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我 已 经 不 记得 多 少 次 向 人 推荐 这 本 书 了 。 这 本 书写 得 好 ， 重 要 的 是 ， 它 涵盖 了 成 为 一 名 高 效 DBA 所 需要 知道 的 所 有 方面 。 


Scott Ambler， 敏 捷 数 据 方法 的 领导 者 


这 是 一 本 精心 编写 和 组 织 的 数据 库 管理 实践 的 指南 。 不 像 一 般 的 数据 库 理 论 或 关系 数据 库 理论 书籍 ， 这 本 书 更 直接 地 侧重 于 
当今 数据 库 专 业 人 员 进 行 数 据 库 管理 的 理论 与 实践 ， 并 且 没有 太 多 迎合 任何 特定 的 产品 实施 。 因 此 ， 数 据 库 管理 非常 适合 那些 有 
兴趣 研究 DBA 或 类 似 但 更 具体 的 角色 (如 数据 建 模 或 数据 库 性 能 分 析 师 ) 的 职责 的 人 。 


一 一 Sal Ricciardi ， 微 软 项 目 经 理 


Craig 的 特点 之 一 是 他 的 写作 清晰 、 易 读 。 任 何 技术 类 书籍 的 主要 目的 是 在 作者 和 读者 之 间 传 递 信息 ， 这 一 点 Craig 做 得 很 
棒 。 他 和 希望 读者 学 习 ， 并 且 完 整 表达 了 自己 的 想法 。 


一 一 Chtis Foot， 远 程 DBA 专 家 和 Oracle ACE 
本 书 涉及 DBA 任 务 和 职责 的 完整 且 全 面 的 清单 ， 从 创建 数据 库 环境 到 数据 仓库 管理 ， 以 及 中 间 可 能 会 发 生 的 一 切 。 
一 一 Mike Tarrani， 计 算 机 顾问 
我 认为 ， 每 一 名 业务 经 理 和 IT 经 理 都 应 该 拥有 这 样 一 本 书 。 


一 一 Dan Hotka， 独 立 顾 问 和 Otracle ACE 


Craig Mullins 的 这 本 书 见解 深刻 。Mullins 以 卓越 的 洞察 力 清晰 描述 了 现代 企业 中 数据 管理 员 和 数据 库 管理 员 的 角色 以 及 他 
们 的 职责 。 


Michael Tozet ， 作 家 及 前 美国 海军 军官 


应 该 说 ， 数 据 库 管理 不 是 什么 新 概念 ， 随 着 它 的 不 断 友 展 ， 数 据 库 管理 员 (DBA) 的 需求 也 在 不 断 增加 。DBA 这 一 职位 揭 
开 了 数据 库 管理 略 带 神秘 的 面纱 ， 为 越 来 越 多 的 公司 和 人 所 熟知 |。 
关于 数据 库 管 理 的 书籍 不 少 ， 其 中 也 不 过 优秀 和 经 典 之 作 。 在 众多 数据 库 管理 书籍 中 ， 本 书 仍 具有 不 可 替代 的 地 位 ， 我 认为 
主要 原因 如 下 。 
. 作者 。 本 书 的 作者 CraigS.Mullins 是 数据 库 管 理 领 域 的 绝对 资深 人 士 ， 在 该 领域 有 超过 30 年 的 工作 经 验 ， 涉 及 数据 库 的 研发 
和 教育 、 系 统 分 析 和 设计 、 数 据 库 和 系统 管理 、 数 据 分 析 和 建 模 等 ， 本 书 是 他 的 两 大 畅销 书 之 一 。 
.内容 编排 。 各 章 按 照 数 据 库 管 理 员 实 际 执行 工作 的 顺序 进行 编排 ， 更 加 便于 想 成 为 DBA 的 人 学 习 ， 或 已 经 是 DBA 的 人 查 


阅 参 考 。 


` 内 容 描述 。 有 别 于 一 般 的 数据 库 理论 或 关系 数据 库 理论 的 书籍 ， 本 书 把 描述 的 重点 放 在 当今 数据 库 管理 人 员 实 际会 用 到 的 


理论 和 实践 。 


与 数据 库 产 品 无 关 。 本 书 的 独特 之 处 是 不 以 市 面 上 任何 一 种 数据 库 产 品 为 例 来 介绍 数据 库 管理 的 技术 和 实践 。 所 以 具有 更 
加 广泛 的 适用 人 群 。 


* 事 无 巨细 。 首 先 ， 本 书 详细 讲述 了 数据 库 管 理工 作 的 方方面面 ， 并 且 在 每 章 的 末尾 对 该 章 的 内 容 进 行 小 结 ， 同 时 提供 了 一 


些 题目 供 读者 思考 和 实践 。 书 中 好 多 地 方 都 体现 出 作者 的 贴心 之 处 ， 比 如 在 书 的 开始 就 以 DBA 和 IT 相关 职位 的 薪资 对 比 告诉 读 
者 DBA 工 作 的 特殊 性 ， 以 及 会 遇 到 的 挑战 和 受到 的 压力 。 稍 后 又 专门 提供 了 常用 的 DBA 工 具 ， 以 及 DBA 的 经 验 法 则 。 同 时 提供 


了 常见 的 DBMS 和 DBA 工 具 供 应 商 ， 以 及 一 些 DBA 网 络 资源 。 更 让 人 觉得 贴心 的 是 ， 作 者 还 给 出 了 一 篇 DBA 招 聘 的 示例 ， 供 相关 


企业 招聘 DBA 或 有 意 应 聘 DBA 的 人 员 参 考 使 用 。 


从 本 书 的 名 字 就 能 了 解 到 ， 这 是 一 本 初级 读本 ， 但 是 它 绝对 不 是 一 本 轻松 的 入 门 教材 。 一 是 因为 DBA 的 工作 任务 烦琐 上 且 需 
要 和 不 同 的 人 打交道 ， 二 是 因为 DBA 的 工作 实践 比 理论 更 重要 。 所 以 ， 一 个 DBA 初 学 者 也 许 能 够 很 快 读 懂 它 ， 但 要 想 真 正 掌握 
还 需要 长 时 间 的 实践 ， 而 本 书 可 以 在 实践 过 程 中 助 他 们 一 臂 之 力 。 总 之 ， 这 是 一 本 很 好 的 学 习 和 参考 书籍 ， 值 得 你 反复 阅读 。 


翻译 这 本 书 ， 完 全 出 于 机 缘 巧 合 。 应 该 说 ， 这 是 我 真正 意义 上 翻译 的 第 一 本 书 ， 翻 译 这 样 一 本 大 部 头 的 确 是 一 件 很 辛苦 的 事 
情 ， 所 以 首先 我 要 感谢 机 械 工业 出 版 社 的 编辑 杨 福 川 ， 让 我 有 机 会 把 这 么 优秀 的 书 翻译 出 来 ， 献 给 对 数据 库 管 理 感 兴趣 的 各 位 朋 
友 。 感 澳 本 书 的 编辑 给 我 提出 了 不 少 非常 好 的 意见 和 建议 ， 使 我 受益 菲 浅 ， 感 谢 对 我 延迟 交 稿 的 容忍 。 还 要 感 澳 我 的 家 人 对 我 的 
理解 和 支持 ， 包 括 精 神 上 的 和 实际 行动 上 的 ， 我 发 现 这 是 不 做 或 少 做 家 务 的 一 个 很 好 的 理由 。 最 后 感谢 朋友 周 移民 的 帮助 ， 使 我 
最 终 完 成 了 这 本 书 的 翻译 工作 。 


如 果 这 本 书 能 够 帮 到 你 ， 这 是 我 最 大 的 落 幸 ! 


相 比 2002 年 写 这 本 书 的 第 1 版 时 ， 现 在 对 数据 库 管 理 的 需求 大 有 增强 之 势 。 关 系数 据 库 管理 系统 仍 处 于 生产 系统 的 核心 ， 它 
们 仍然 需要 数据 库 管 理 员 的 管理 。 无 论 你 使 用 的 是 Oracle、Microsoft SQL Server, DB2, Informix, Sybase, MySQL, 
Teradata, PostgreSQL, Ingres, 或 者 是 这 些 流行 的 DBMS 产 品 的 任意 组 合 ， 你 都 会 从 本 书 中 受益 菲 浅 。 


但 是 在 信息 技术 领域 ,十 年 就 是 永远 。 即 使 一 些 基 本 的 东西 保持 不 变 (如 数据 库 需 要 管理 ) ， 很 多 事情 都 在 变化 。 这 本 书 的 
第 2 版 收录 了 在 过 去 的 十 年 中 这 个 行业 所 发 生 的 对 数据 库 管理 产生 影响 的 许多 变化 。 这 也 是 本 书 的 独特 之 处 。 同 时 ， 它 还 是 业界 
唯一 不 基于 任何 产品 来 介绍 数据 库 管 理 技术 和 实践 的 书籍 。 本 书 定义 了 数据 库 管理 员 的 工作 ， 并 且 用 清晰 、 简 单 易 懂 的 语言 概述 
了 哪些 是 数据 库 管理 员 (或 DBA) 所 必需 的 。 本 书 可 以 : 


用 作 学 习 数 据 库 管理 准则 的 教材 。 
- 用 作 建 立 DBA 组 的 依据 。 


. 用 来 增加 特定 DBMS 的 手册 或 教材 。 


. 用 来 帮助 高 层 管理 人 员 理 解 什 么 是 DBA， 以 及 为 什么 需要 这 个 职位 。 


新 加 了 哪些 内 容 ” 这 个 版 本 的 重大 改进 之 一 是 覆盖 合 规 性 。 政 府 和 行业 法 规 的 数量 在 过 去 的 十 年 呈 爆 炸 式 增长 ， 并 且 许 多 法 
规 规定 了 数据 管理 、 处 理 和 加 工 方式 的 变化 。 其 中 最 明显 的 政府 法 规 无 疑 是 Sarbanes-Oxley Act (又 名 《美国 公众 公司 会 计 改 
革 和 投资 者 法 案 》，2002 年 ) ， 还 有 许多 其 他 的 法 案 ， 包 括 HIPAA 和 GLB (Gramm-Leach-Bliley 法 案 ) 。 最 明显 的 行业 法 规 是 
PCI DSS (支付 卡 行业 数据 安全 标准 ) 。 所 有 这 些 法 规 和 很 多 其 他 法 规 一 起 ， 给 数据 施加 了 额外 的 行政 负担 。 本 书 用 了 一 整 章 专 
门 讨论 这 个 话题 ， 包 括 监管 合 规 性 对 数据 管理 任务 的 影响 ， 例 如 ， 元 数据 管理 、 数 据 质量 、 数 据 库 审计 、 数 据 屏 蔽 (data 
mask) [1、 数 据 库 归档 ， 以 及 更 传统 的 DBA 任 务 ， 如 数据 库 变更 管理 和 数据 库 恢复 。 


数据 库 安 全 是 另 一 个 快速 发 展 的 领域 ， 基 于 此 需要 对 第 1 版 进行 重大 调整 。 本 书 在 安全 功能 和 需求 方面 提供 了 全 新 的 覆盖 范 
围 ， 包 括 基于 标签 的 访问 控制 、 加 密 和 阻止 SQL 注入 攻击 。 


本 书 增加 了 十 年 前 尚未 广泛 采用 的 技术 (如 XML) ， 并 且 适 当 讨论 了 DBA 应 该 关注 的 新 生 技 术 ， 包 括 NoSQL 和 云 计 算 。 同 
时 ， 也 覆盖 了 一 些 较 新 的 DBM S 功 能 ， 如 时 态 数据 库 支 持 和 INSTEAD-OF 触 发 器 。 


最 后 ， 整 本 书 经 过 了 审查 和 修订 以 确保 每 个 主题 都 添加 了 最 新 的 技术 和 需求 。 本 书 特别 关注 那些 DBMS 功 能 用 于 凸显 特定 技 
术 的 例子 是 准确 的 并 且 是 最 新 的 。 例 如 ，DB2 HADR、SQL Server 2012 AlwaysOn 和 Oracle Transparent Data Encryption. 


通过 学 习 这 本 书 ， 你 可 以 得 到 实施 和 维护 异 构 数据 库 管理 方面 最 及 时 、 最 准确 且 最 新 的 指导 。 你 可 以 用 它 来 了 解 成 为 一 名 成 
功 的 数据 库 管 理 员 需要 具备 什么 。 还 可 以 在 工作 中 将 本 书 和 特定 DBMS 产 品 供应 商 的 手册 或 产品 说 明 书 结合 使 用 。 


如 何 使 用 这 本 书 


这 本 书 可 以 作为 教程 和 参考 。 本 书 按照 可 能 会 遇 到 的 所 有 DBA 任 务 执行 的 时 间 顺 序 编排 。 因 此 ， 如 果 你 从 第 1 章 到 第 24 章 依 
次 阅读 本 书 ， 你 会 对 DBA 的 工作 有 一 个 全 面 、 顺 序 的 了 解 。 你 也 可 以 单独 阅读 任何 一 章 ， 因 为 每 一 章 都 涉及 一 个 主题 。 如 果 书 
中 其 他 材料 对 读者 的 理解 有 帮助 ， 本 书 也 明确 指出 了 参考 章节 。 


0] 也 称 为 “数据 遮 唱 ”。 


编辑 注 


致谢 


写作 是 一 项 有 益 的 工作 ， 但 是 也 需要 大 量 的 时 间 : 调查、 撰写、 审查、 编辑 以 及 一 遍 又 一 遍地 改写 ， 直 到 满意 为 止 。 但 没有 
人 仅 赁 想象 就 可 以 写 出 一 本 技术 类 的 书籍 。 在 这 本 书 的 写作 过 程 中 ， 我 遇 到 很 多 知识 渊博 且 乐 于 助人 的 朋友 ， 他 们 给 予 了 太 多 的 
帮助 。 


首先 ， 我 想 感谢 许多 业内 专家 审查 了 原 书 的 提案 。 下 面 这 些 人 对 我 的 原作 大 纲 提 出 了 很 多 有 用 的 建议 和 想法 ， 使 我 的 书 变 得 
更 好 ， 他 们 是 : Michael Blaha, Keith W.Hare, Michael J.Hernandez, Robert S.Seiner 和 David LWells。 此 外 ， 我 要 感谢 
大 家 在 我 开始 写 这 本 书 之 前 肯 花 时 间 听 我 讲述 构思 。 这 份 名 单 实 在 太 长 ， 我 无 法 记 住 你 们 每 一 个 人 的 名 字 ， 但 你 心里 明白 。 


我 想 感谢 那些 审查 全 文 并 对 其 给 予 评 论 的 人 们 。 在 本 书 的 第 2 版 中 ，Bill Arledge 和 Kevin Kline 在 审查 过 程 发 挥 他 们 的 专 
长 ， 提 供 了 许多 有 益 的 建议 并 进行 了 大 量 修改 ， 提 高 了 本 书 的 质量 。 我 们 不 会 忘记 参与 第 1 版 审查 的 人 员 : Dan Hotka, Chris 
Foot, Chuck Kosin, David LWells 和 Anne Marie smith， 他 们 详细 阅读 了 每 章 各 种 版 本 的 稿件 ， 这 本 书 是 对 他 们 努力 付出 的 
回报 。 特 别 要 感谢 数据 建 模 和 管理 大 师 William J.Lewis 和 Robert S.Seiner， 他 们 在 百 忙 之 中 抽出 时 间 对 本 书 的 第 3 章 进行 了 审 


查 ， 并 提出 了 宝贵 的 建议 。 我 还 想 感谢 我 的 兄弟 Scott Mullins， 他 对 第 5 章 进行 了 审查 ， 并 对 应 用 程序 设计 和 开发 提供 了 指导 。 


感谢 Mary Barnard， 她 出 色 地 完成 了 第 1 版 的 编辑 工作 。 还 有 Greg Doench， 同 样 出 色 地 完成 了 第 2 版 的 编辑 工作 。 她 们 两 
位 使 我 的 书 更 具 可 读 性 。 


此 外 ， 感 谢 Addison-Wesley 出 版 社 那些 与 我 一 起 工作 的 人 ， 他 们 善 解 人 意 并 且 很 有 耐心 ， 使 得 两 个 版 本 都 能 够 顺利 出 版 。 
他 们 是 : Michelle Housley, Patrick Peterson, Stacie Parillo、Barbara Wood 和 Mary O' Brien， 他 们 在 协调 书生 产 的 整个 
过 程 中 都 给 予 了 特别 的 帮助 。 


也 要 感谢 我 出 色 的 妻子 Beth， 有 了 她 的 理解 和 支持 ， 我 才 可 能 写 出 这 本 书 。 事 实 上 ， 要 感谢 我 所 有 的 家 人 和 朋友 一 贯 的 支 
持 和 帮助 。 


最 后 ， 感 谢 与 我 有 专业 上 合作 的 所 有 人 ， 他 们 分 别 来 自 : SoftwareOnZ、NEON Enterprise Software, Embarcadero 
Technologies, BMC Software, Gartner Group, PLATINUM Technology, Inc.、Duquesne Light Company, Mellon 
Bank, USX Corporation 和 ASSsET，lnc.。 这 本 书 之 所 以 能 变 得 更 好 ， 是 因为 我 有 幸 与 如 此 之 多 优秀 的 人 员 一 起 合作 。 


第 1 章 ”什么 是 DBA 


每 一 家 使 用 数据 库 管 理 系统 (DBMS) 管理 数据 的 公司 都 需要 数据 库 管 理 (DBA) 组 来 确保 能 够 有 效 地 使 用 和 部 署 公司 的 数 
据 库 。 如 今 各 种 规模 的 企业 都 会 至 少 使 用 一 种 DBMS， 这 使 得 对 数据 库 管理 员 (DBA) 的 需求 比 以 往 任何 时 候 都 要 多 。 然 
而 ，DBA 的 准则 要 么 不 容易 理解 ， 要 么 在 推广 时 不 能 使 用 。 


对 数据 库 管 理 员 (DBA) 的 需求 比 以 往 任何 时 候 都 要 多 。 


关于 数据 库 管 理 ， 有 个 经 常 说 起 的 笑话 ， 它 可 以 帮助 我 们 认识 DBA 的 必要 性 和 我 们 对 DBA 工 作 认 知 的 不 足 。 笑 话 大 概 是 这 
样 的 : 


Acme 公 司 的 CIO 聘 请 一 家 管理 顾问 公司 来 帮助 他 们 简化 工作 流程 。 为 了 了 解 Acme 的 工作 方式 ， 顾 问 与 CIO 进 行 了 面谈 。 其 
中 一 个 问题 是 : “ 嗯 ， 我 看 到 你 们 员工 中 有 DBA， 他 是 干什么 的 ? ” 


CIO 回 答 道 : “ 哦 ， 我 们 使 用 Oracle， 有 人 跟 我 说 ， 我 们 必须 要 用 DBA 来 保证 Oracle 数 据 库 长 期 在 线 。 我 知道 ， 我 们 的 一 些 
关键 业务 流程 如 订单 录入 和 库存 会 使 用 DOtacle， 我 还 真 不 知道 DBA 是 干什么 的 。”CIO 继 续 说 ，“ 请 不 要 告诉 我 还 要 一 个 吧 ， 就 
这 个 的 工资 我 们 都 付 不 起 了 ! ” 


翡 哀 吧 ， 但 这 往往 是 事实 ， 许 多 公司 的 数据 库 管理 就 是 这 样 的 状况 。DBA 经 常会 被 视 作 一 个 牧师 或 者 魔术 师 ， 他 们 用 魔术 
使 得 数据 库 系统 能 够 有 效 运作 。 如 今 的 DBM 软件 非常 复杂 ， 导 致 只 有 极 少数 人 能 够 像 了 解 基础 知识 (如 SQL) 那样 了 解 它们 。 
但 是 DBA 只 有 了 解 了 DBMS 的 复杂 性 ， 才 能 变 得 更 有 价值 。 事 实 上 ， 很 多 时 候 公司 内 既 懂 数据 库 管理 又 懂 开 发 知识 的 只 有 
DBA, 


DBA 的 角色 就 是 公司 数据 资产 的 监护 人 。 所 以 ，DBA 会 小 心 驾 如 地 保护 着 他 们 的 数据 。 而 开发 人 员 负 责 开发 新 的 应 用 程 
序 ， 他 们 会 经 常 遇 到 挑战 ， 要 求 快速 开发 ， 一 个 项 目 接着 一 个 项 目 。 很 明显 ， 两 种 角色 和 他 们 对 工作 的 期 望 的 不 同 ， 会 在 他 们 之 
间 制 造 出 摩擦 一 DBA 说 我 要 “变更 控制 ， 变 更 管理 ”， 而 开发 人 员 则 说 我 要 “现在 就 部 署 ”。 


对 DBA 常 有 的 另 一 个 评价 是 他 们 很 难 相处 。 他 们 时 常 被 视 作 自命 不 凡 ， 拥 有 丰富 的 技术 知识 但 人 际 交往 能 力 有 限 。 大 约 每 
一 个 数据 库 程序 员 都 有 个 关于 DBA 的 故事 。 这 些 趣闻 轶 事 经 常会 以 “我 有 个 问题 请 教 .…..” 开 头 ， 而 以 “.….. 最 后 他 (DBA) 告 
诉 我 不 要 打扰 他 了 ， 自 己 去 看 说 明 书 ”结束 。DBA 在 人 们 心中 的 形象 不 是 “ 暖 融融 ”的 ， 大 部 分 是 他 们 的 工作 特点 和 范围 所 
致 。DBMS 贯 穿 了 整个 企业 ， 企 业 需 要 制订 有 效 使 用 DBA 的 流程 。 

事实 上 ，DBA 经 常 不 得 不 坐 下 来 独自 完成 一 些 事情 ， 这 或 许 能 够 缓解 他 们 的 负面 形象 。 许 多 数据 库 问 题 需要 一 段 时 间 来 安 
静 地 思考 和 分 析 才 能 够 解决 。 所 以 ，DBA 一 般 不 喜欢 被 打扰 。 但 是 ， 即 便 有 一 些 问题 需要 他 们 独自 解决 ， 还 是 会 有 许多 的 问题 
需要 团队 合作 。 而 且 由 于 大 部 分 的 DBA 拥 有 丰富 的 知识 ， 实 际 上 ， 他 们 的 工作 经 常会 被 回答 和 解决 问题 中 断 ， 因 此 他 们 安静 思 
考 的 时 间 会 很 少 。 

DBA 的 孤立 行为 不 应 该 得 到 肯定 ， 而 应 该 通过 培训 使 他 们 获得 良好 的 沟通 技巧 。 数 据 是 应 用 程序 的 命脉 。 开 发 应 用 程序 就 
是 对 数据 的 读 写 、 分 析 、 移 动 、 计 算 和 修改 等 。 没 有 数据 ， 程 序 就 一 无 是 处 。DBA 处 在 整个 开发 生命 周期 的 核心 位 置 一 一 他 们 
确保 应 用 程序 能 够 有 效 、 准 确 地 访问 企业 数据 。 通 常 ，DBA 经 常 和 许多 不 同 种 类 的 人 打交道 ,包括 技术 人 员 、 程 序 员 、 终 端 用 
户 、 客 户 和 领导 。 然 而 ， 许 多 DBA 过 于 关注 DBMS 的 内 部 技术 细节 ， 而 忽略 了 提高 与 他 们 同事 或 客户 的 沟通 技巧 。 


DBA 需 要 学 习 良 好 的 沟通 技巧 。 


到 现在 ， 我 们 还 没有 回答 本 章 标 题 的 问题 : 什么 是 DBA? 简短 地 回答 : DBA 是 信息 方面 的 专家 ， 他 们 确保 企业 的 日 常 工作 
正常 运转 ， 确 保 企业 的 数据 库 以 及 访问 这 些 数据 库 的 应 用 程序 的 有 效 性 。 


DBA 是 信息 方面 的 专家 ， 他 们 确保 企业 的 日 常 工作 正常 运转 ， 确 保 企 业 的 数据 库 以 及 访问 这 些 数据 库 的 应 用 程序 的 有 效 


而 本 书 ， 就 是 回答 这 个 问题 的 具体 答案 。 本 书 将 会 定义 数据 库 管理 的 管理 准则 ， 并 且 为 DBA 的 工作 顺利 进行 提供 练习 指 
导 。 为 了 开始 回答 这 个 问题 ， 本 章 将 会 提供 数据 库 管理 的 概括 性 介绍 ， 包 括 为 什么 把 DBA 作 为 一 种 职业 ? DBA 深 层次 工作 介 
绍 ， 还 有 企业 DBA 团 队 的 组 织 架 构 。 


1.1 为 什么 学 习 数 据 库 管 理 


我 们 已 经 提 到 过 ， 数 据 是 应 用 程序 的 核心 ， 如 今 现 代 化 公司 离开 了 数据 就 不 能 运行 。 从 某 种 意义 上 来 说， 现 如 今 业 务 就 是 数 
据 。 [如 果 没 有 数据 ， 企 业 将 没有 能 力 来 管理 财政 、 进 行 交易 ， 或 联系 客户 。 创 建 数据 库 就 是 为 了 存储 并 组 织 这 些 数据 。 数 据 
库 的 设计 越 好 ， 对 它们 的 利用 越 好 ， 公 司 的 商业 竞争 力 会 越 强 。 


诸多 IT 公 司 面 临 的 最 大 问题 之 一 就 是 怎样 确保 数据 库 管 理 的 质量 。 根 据 最 近 的 一 项 调查 显示 : A 


- 好 的 DBA 很 难 找 ， 而 且 要 价 很 高 
要 3 个 月 以 上 。 


76% 的 受 调 查 对 象 表示 最 少 要 用 3 个 月 才能 招 到 一 名 DBA， 就 算 培 训 一 名 新 的 DBA 也 


* 支撑 应 用 程序 的 数据 库 基础 设施 复杂 ， 长 期 分 散 ， 且 不 易于 管理 。 


所 有 这 些 调查 结果 都 清晰 地 表明 数据 库 管理 是 一 项 有 难度 的 、 要 求 非常 高 的 工作 。 还 有 ， 根 据 Dice Bl2010-2011 的 技术 薪 
资 调查 表明 ， 每 天 发 布 的 工作 需求 中 有 超过 15000 份 工作 要 求 有 Oracle 经 验 。 对 Oracle 技 术 的 需求 每 年 都 高 达 57%， 而 有 Oracle 
工作 经 验 的 技术 专家 的 平均 薪资 是 90914 美 元 。 


[L] 社会 媒体 使 得 这 种 趋势 更 加 明显 。 人 们 将 自己 正在 经 历 的 生活 以 数据 驱动 的 形式 记录 下 来 ， 并 向 世界 大 声 宣 扬 着 。 
[2] 2006 年 题 为 “数据 库 管 理 的 趋势 : 自动 化 机 遇 ” 的 GridApp 系 统 研究 。 
[3] Dice.com 有 是 一 个 求职 网 站 ， 是 技术 和 工程 专业 人 员 ， 以 及 需要 这 些 人 员 的 公司 的 一 个 平台 。 


1.2 ”独特 的 优势 


一 名 优秀 的 DBA 要 享受 挑战 并 且 还 得 是 出 色 的 问题 终结 者 。 


DBA 负 责 设计 和 维护 企业 的 数据 库 ， 他 处 在 企业 的 核心 位 置 。 这 样 ，DBA 就 有 机 会 去 学 习 各 个 方面 的 业务 ， 以 及 知晓 知识 
间 的 关联 。 他 们 还 能 研究 公司 的 前 沿 技术 ， 这 使 得 他 们 的 工作 充满 了 新 鲜 感 一 一 但 是 第 一 次 尝试 找 出 一 项 新 技术 是 怎样 工作 的 
过 程 中 可 能 会 有 挫折 感 。DBA 常 常 是 独自 努力 研究 ， 在 遇 到 问题 的 时 候 不 会 有 其 他 专家 帮忙 。 因 此 ， 一 名 优秀 的 DBA 要 享受 挑 
战 并 且 还 得 是 出 色 的 问题 终结 者 。 


1.2.1 ”DBA 的 薪资 


作为 技术 人 员 你 不 会 找到 比 DBA 更 有 挑战 的 IT 相 关 工 作 了 。 幸 运 的 是 ，DBA 的 工作 报酬 也 是 相当 丰厚 的 。 根 据 一 项 由 全 球 知 
(Global Knowledge) 【| 与 技术 团体 组 织 的 薪资 调查 ，[ 所 DBA 的 薪资 是 78468 美 元 ， 而 DBA 管 理 者 的 平均 薪资 是 87261 美 
。 这 些 平均 薪资 的 数字 比 另外 一 项 JancoB 薪 资 调查 (前 些 年 进行 的 ) 略 低 。 
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对 于 全 职 的 DBA 来 说， 既定 薪资 最 高 可 达 80000 美 元 。 表 1-1 详 细 给 出 了 在 2006~2011 年 间 DBA 的 既定 薪资 (数据 来 自 Dice 
2010-2011 的 技术 薪资 调查 ) 。 


表 1-1 2006 到 2011 年 DBA 的 既定 薪资 


年 份 DBA 的 既定 薪资 
2006 ~ 2007 85 441 美元 
2007 ~ 2008 85 092 美元 
2008 ~ 2009 89 742 美元 
2009 ~ 2010 91 283 美元 
2010 ~ 2011 88 443 美元 


请 注意 这 里 引用 的 薪资 数字 仅 作 说 明之 用 ， 它 们 会 随 多 种 因素 而 变化 。 随 着 工作 年 限 和 从 业 人 数 的 增加 ， 薪 资 也 必然 随 之 增 
加 。 当 然 了 ，DBA 的 薪资 和 其 他 人 的 薪资 一 样 也 会 因 地 域 的 不 同 而 不 同 。 在 美国 ， 东 北部 地 区 和 西海 岸 的 DBA 薪 资 有 可 能 是 比 
其 他 区 域 高 。 行 业 类 型 也 是 因素 之 一 ， 比 如 ， 制 药 厂 比 政府 部 门 的 薪资 要 高 。 当 这 些 所 有 的 因素 都 考虑 到 了 ，DBA 的 薪资 数字 
就 会 稳 居 IT 从 业 人 员 之 首 。 


根据 2012 年 计算 机 世界 杂志 的 薪资 调查 ， 全 国 DBA 的 平均 薪资 是 95187 美 元 ， 而 一 个 有 着 15~20 年 工作 经 验 目 在 太平 洋 海 
岸 工作 的 DBA 的 平均 薪资 却 是 103597 美 元 。 内 显然 ， 工 作 经 验 和 工作 地 点 造成 了 显著 的 差异 。 


美国 劳工 统计 局 (BLS) _D] 提 供 了 有 关 DBA 和 雇佣 和 报酬 的 附加 信息 。 自 2012 年 5 月 起 ，BLS 的 报告 称 数据 库 管理 员 的 年 平均 
工资 的 中 线 是 73490 美 元 ， 而 既定 年 平均 工资 是 75730 美 元 。10% 的 低 工资 的 人 挣 得 少 于 41570 美 元 ， 而 10% 的 高 工资 的 人 挣 得 


高 于 115660 美 元 。BLS 还 对 收入 统计 按照 地 理 区 域 进行 了 划分 ， 你 还 可 以 根据 他 们 的 数据 来 确定 你 所 在 区 域 的 期 望 薪资 范围 。 


或 许 你 的 再 就 业 能 力 比 报酬 更 重要 ， 受 雇 作 为 一 名 DBA 的 前 景 是 相当 好 的 。 根 据 美国 劳工 统计 局 职业 展望 手册 2010 一 2011 
版 ，“ 预 计 就 业 增长 速度 超过 了 平均 值 ， 工 作 的 前 景 应 当 是 非常 好 的 ”。 事 实 上 ， 在 2008~2018 年 间 ，BLS 预 佑 DBA 工 作 的 数量 
会 增加 20%。 


DBA 的 工作 市 场 增长 速度 超过 了 平均 值 。 


所 以 ，DBA 是 高 薪资 、 高 就 业 率 、 极 具 挑 战 性 的 工作 ， 并 且 有 可 能 从 事 最 紧急 、 最 重要 的 项 目 。 有 什么 理由 不 喜欢 吗 ? 是 
的 ， 人 们 期 望 DBA 知 道 一 切 ， 不 只 是 数据 库 技 术 ， 还 包括 与 之 相关 的 一 切 。DBA 几 乎 从 来 没有 每 天 只 工作 8 小 时 ， 经 常 是 连续 好 
几 天 加 班 ， 特 别 是 当 数 据 库 的 性 能 出 现 问题 或 者 开发 中 的 项 目 落 后 于 预定 计划 时 。 据 行业 分 析 师 分 析 ，DBA 的 每 周平 均 工 作 时 
间 是 50+ 小 时 ， 其 中 包含 周末 6 小 时 。DBA 经 常 不 得 不 在 周末 和 节假日 这 些 数据 库 使 用 的 低谷 时 间 去 维护 数据 库 。 


数据 库 管 理 是 一 项 没有 休息 的 工作 。 


DBA 不 但 是 一 项 技术 上 有 挑战 且 有 回报 的 工作 ， 还 是 一 项 有 可 能 使 你 盘 疲 力 尽 、 饱 受挫 折 的 工作 。 但 是 干 万 不 要 让 这 些 把 
你 吓 住 了 ， 这 项 工作 的 好 的 方面 远 比 不 好 的 方面 多 。 


[1] 全 球 知 识 是 一 家 技术 培训 公司 。 

[2] Tech Republic 是 ZDNet 公布 的 门户 网 站 。 

[3] Janco Associates,Inc. 是 一 家 致力 于 管理 信息 系统 的 管理 咨询 公司 。 
[4] www.computetworld.com/s/article/9224243/IT_Salary_Survey_2012. 


[5] www.bls.gov/ o 


1.2.2 ”数据 库 技 术 


DBA 是 精通 数据 库 技术 具体 细节 的 !T 专 业 人 士 。 因 此 ， 他 们 对 数据 库 管理 基本 原理 有 扎实 的 理解 非常 重要 。 这 就 要 求 不 仪 要 
懂得 行 、 列 和 表格 或 SQL 这 些 简单 的 知识 了 。 


本 书 假设 读者 对 关系 数据 库 技术 和 DBMS 基 本 原理 已 有 基本 的 了 解 。 对 于 需要 回顾 这 些 概念 的 读者 ， 请 参阅 附录 A。 “数据 
库 基础 ”可 不 是 一 件 小 事 。 问 题 是 ， 有 时 人 们 认为 他 们 知道 的 很 多 。 例 如 ， 这 个 问题 : 什么 是 数据 库 ? 我 敢 说 大 多 数 的 人 相信 他 
们 知道 这 个 问题 的 答案 。 但 其 中 一 部 分 人 (或 者 很 多 ) 都 会 答 错 。SQL Server 不 是 数据 库 ， 它 只 是 一 种 DBMS (数据 库 管 理 系 
统 ) 。 你 可 以 使 用 SQL Server 来 创建 数据 库 ， 但 SQL Server 本 身 不 是 一 种 数据 库 。 


那么 ， 什 么 是 数据 库 ” 数据 库 是 一 种 有 组 织 的 数据 存储 ， 其 中 的 数据 可 以 通过 指定 的 数据 元 素 (比如 ， 字 段 、 记 录 和 文件 ) 
来 访问 ( 详 见 图 1-1) 。 


备份 与 恢复 


SQL 优化 


图 1-1 DBMS 对 数据 库 


数据 库 是 一 种 有 组 织 的 数据 存储 ， 其 中 的 数据 可 以 通过 指定 的 数据 元 素来 访问 。 


DBMS 是 一 种 使 终端 用 户 或 程序 员 能 够 共享 数据 的 软件 。 它 提供 了 一 套 操作 数据 库 的 系统 性 方法 : 创建 、 更 新 、 检 索 和 存储 
信息 。DBMS 通 常 还 负责 数据 完整 性 、 数 据 安全 性 、 数 据 访问 控制 和 优化 、 自 动 回 退 、 重 起 和 恢复 。 


对 外 行人 来 说 ， 你 可 以 把 数据 库 想象 成 一 个 文件 夹 ， 把 DBMS 想 象 成 文件 柜 ， 且 所 容纳 的 所 有 文件 都 贴 有 标签 。DBMS 管 理 
着 数据 库 ， 通 过 DBMS 来 实现 和 访问 数据 库 实 例 。 所 以 说 ，DB2、Oracle 和 SQL Server 都 是 数据 库 管 理 系统 。 工 资 单 应 用 使 用 
工资 单 的 数据 库 ， 该 数据 库 可 以 使 用 DB2、Oracle 或 者 SQL Server 来 实现 。 


为 什么 DBMS 如 此 重要 呢 ” 因为 如 果 在 工作 区 使 用 的 术语 不 精确 ， 就 会 引起 混淆 ， 进 而 导致 项 目 超出 预算 ， 开 发 的 系统 不 正 
常 ， 失 去 生产 力 。 


除了 数据 库 管 理 的 基本 原理 ，DBA 还 要 对 使 用 的 所 有 DBMS 产 品 (一 家 企业 可 能 使 用 多 种 ) 非常 精通 。 例 如 ， 一 家 大 型 的 企 
业 可 能 在 中 央 主 机 使 用 DB2， 而 在 几 个 不 同 的 UNIX 平 台 上 使 用 Oracle 和 Informix， 在 Linux 上 使 用 MySQL， 在 Windows 上 使 用 
SQL Server。 旧 的 遗留 系统 上 可 能 使 用 的 是 IM SS 数据库， 然而 的 确 有 个 别 “ 疯 狂 的 程序 ”使 用 了 边缘 的 DBMS， 如 Adabas 或 


Ingres, [1] 还 有 一 些 新 的 数据 库 技 术 ， 如 NoSQL， 以 及 列 存储 的 DBMS 产 品 (如 Hadoop) 。 还 有 云 数据 库 系统 ， 如 Microsoft 
SQL Azure 和 Google BigTable, 


因此 ，DBA 组 要 有 应 对 这 些 不 同 的 数据 库 管理 系统 和 平台 的 专业 知识 。 与 此 同时 ，DBA 还 要 能 够 确定 哪些 数据 库 管理 系统 
和 平台 最 能 满足 某 个 应 用 程序 的 需要 。 这 是 一 项 艰难 的 工作 ， 充 满 了 博弈 和 冲突 意见 。 这 时 候 DBA 组 要 通过 对 比 每 种 数据 库 管 
理 系统 和 平台 ， 然 后 根据 应 用 程序 的 需要 来 做 出 正确 的 选择 。 


DBA 要 决定 最 匹配 的 应 用 程序 、DBMS 和 平台 。 
有 关 DBMS 概 念 的 简短 介绍 ， 请 参阅 附录 A。 


四 之 所 以 将 Adabas 和 Ingres 视 为 “边缘 ”， 并 不 是 因为 任何 功能 和 技术 缺陷 ， 而 是 它们 所 占 的 市 场 份额 较 小 。 


1.3 DBA 的 管理 准则 


数据 库 管 理 很 少 被 视 作 一 种 管理 准则 。 “准则 ”一 词 意味 着 规划 并 按照 该 规划 实施 。 当 数据 库 管理 被 视 作 一 项 管理 准则 时 ， 
公司 内 部 的 数据 处 理 就 会 有 所 改善 了 。 这 就 是 消极 被 动 和 积极 主动 的 区 别 。 

DBA 组 让 需求 和 问题 淹没 是 家 常 便 饭 。 这 有 多 种 原因 ， 包 括 人 员 缺 乏 、 过 度 承诺 支持 新 的 〈 甚 至 现 有 的 ) 应 用 程序 开发 项 
目 、 缺 少 可 遵循 的 流程 和 缺少 预算 等 。 这 种 情况 下 ， 数 据 库 管理 员 就 会 变 得 消极 被 动 。 消 极 被 动 的 DBA 更 像 是 名 消防 员 ， 他 集 
中 注意 力 去 解决 所 关注 的 最 大 问题 。 换 名 话说， 消极 被 动 的 DBA 只 有 当 问题 发 生 后 才 尝 试 去 解决 它们 。 


积极 主动 的 DBA 在 企业 内 部 部 署 数据 库 时 ， 通 过 制订 并 执行 战略 蓝图 ， 以 避免 诸多 问题 。 该 蓝图 应 当 针对 应 用 程序 开发 周 
期 (ADLC， 详 见 图 1-2) 的 所 有 阶段 。 积 极 主动 的 DBA 通 过 执行 规范 和 操作 流程 ， 避 免 问 题 发 生 。 


起 始 


图 1-2 应 用 程序 开发 生命 周期 (ADLC) 
积极 主动 的 DBA 能 避免 许多 问题 。 


数据 专家 ， 通 常 指 DBA， 应 当 参 与 ADLC 的 每 一 个 阶段 。 在 项 目 启 动 和 需求 收集 阶段 ，DBA 就 要 着 手 识别 出 项 目的 数据 成 
分 。 他 能 够 帮助 确认 所 需 的 数据 已 在 别处 存在 或 者 是 窑 新 的 。 在 分 析 和 设计 阶段 ， 他 要 把 基本 数据 需求 转换 成 一 种 概念 性 的 、 逻 
辑 上 的 数据 模块 。 


开始 开发 前 ， 逻 辑 上 的 数据 模块 要 转换 为 一 种 物理 的 数据 库 设 计 ， 它 可 以 用 DBMS 实 施 ， 如 Oracle 或 DB2。 同 时 ， 样 本 数据 
必须 要 植 入 物理 数据 库 中 ， 用 于 测试 应 用 程序 。 除 此 之 外 ，DBA 还 要 通过 开发 并 实施 一 种 流程 去 刷新 测试 数据 ， 进 而 使 得 重复 
的 测试 能 够 进行 。 


当 应 用 程序 开发 完毕 并 开始 运行 时 ，DBA 要 确保 DBM 为 新 负载 做 好 了 准备 。 包 括 : 执行 适当 的 安全 措施 ， 衡 量 并 修改 新 应 
用 程序 对 存储 盘 和 内 存 的 需求 ， 预 估 新 负载 对 现 有 的 数据 库 和 应 用 程序 会 带 来 什么 影响 。DBA 也 负责 新 数据 库 从 测试 环境 到 生 
产 环境 的 迁移 。 


应 用 程序 运行 时 ，DBA 要 履行 “主机 ”的 职责 ， 包 括 性 能 和 有 效 性 监控 、 调 试 、 备 份 和 恢复 、 权 限 管理 。 但 没有 程序 或 数 


据 库 是 长 期 保持 不 变 的 ， 因 为 业务 的 需求 会 改变 ， 支 撑 业 务 的 IT 系统 也 会 改变 。 当 需要 维护 时 ，DBA 又 要 再 次 忙于 从 需求 收集 到 
应 用 程序 运行 的 整个 过 程 了 。 当 监控 发 现 了 一 处 性 能 缺陷 时 ，DBA 要 向 开发 团队 (如 果 问 题 出 在 程序 代码 上 ) ， 或 者 向 负责 存 
储 的 团队 (如 果 I/O 是 瓶颈 ) 建议 更 好 的 性 能 方案 ， 或 者 推荐 其 他 的 解决 方案 ， 如 新 的 或 提升 了 的 标准 、 蔡 代 性 的 SQL 代码 ， 等 
和 

隐私 条 款 与 隐私 数据 


数据 隐私 是 一 个 新 兴 的 问题 ， 正 在 成 为 越 来 越 多 的 企业 的 负担 。 不 仅 要 管理 的 数据 量 增加 了 ， 新 数据 出 现 的 速度 也 增加 了 。 


在 这 个 网 络 化 的 世界 中 ， 我 们 彻底 数字 化 了 。 我 们 有 ID、 位 置 、 操 作 、 采 购 、 关 联 、 动 作 ， 还 有 存储 的 历史 数据 。 我 们 不 
禁 要 问 了 : 是 谁 在 收集 这 些 数据 ? 他 们 要 用 这 些 数 据 干什么 ? 他 们 和 谁 共享 这 些 数据 ? 最 重要 的 是 ， 每 个 人 都 会 问 的 是 “我 怎样 
保护 我 的 信息 不 被 滥用 ”。 这 些 都 是 合情合理 的 问题 ， 我 们 都 想 知道 答案 


在 美国 ， 有 超过 30 种 联邦 法 规 和 超过 100 种 国家 法 规 来 管制 信息 隐私 ,而 对 个 人 隐私 却 一 直 是 采用 头痛 医 头 、 脚 痛 医 脚 的 方 
式 。 另 一 方面 ， 欧 洲 联 盟 已 经 下 达 了 数据 保护 指令 ， 要 求 其 成 员 国 通过 法 律 实现 其 职权 。 该 指令 为 信息 收集 的 受众 赋予 了 权利 ， 
称 受 众 为 “数据 当事人 ”。 收 集 信息 的 工作 人 员 必 须要 向 数据 当事人 说 明 谁 在 收集 数据 ? 最 终 谁 能 够 访问 这 些 数据 ? 为 什么 要 收 
集 数 据 ? 数据 当事人 也 有 权限 访问 和 修改 他 们 的 数据 。 


其 至 还 有 数据 隐私 日 ，[1 其 目的 是 为 了 表达 对 那些 通过 个 人 信息 表达 自己 的 人 的 尊重 。 


最 近 破 产 的 Borders 书 店 提供 了 一 个 隐私 政策 影响 企业 数据 的 例子 。Borders 停 止 经 营 的 同时 ， 一 家 竞争 对 手书 商 Barnes&Noble 
收购 了 Borders 的 部 分 资产 ， 包 括 Borders 的 品牌 商标 和 客户 名 单 。 然 而 ， 其 第 一 个 行动 就 是 提醒 客户 他 们 的 权利 。 我 收 到 的 E-mail 
是 这 样 说 的 (部 分 内 容 ) : 


然而 ， 重 要 的 是 你 要 明白 ， 你 有 绝对 的 权利 选择 退出 ， 不 使 你 的 客户 数据 转移 到 Barnes&Noble。 如 果 你 选择 退出 ， 我 们 将 确 
保 从 Botdets 收 到 的 所 有 有 关 你 的 数据 会 以 安全 保密 的 方式 处 理 掉 。 


这 个 例子 说 明了 隐私 政策 是 如 何 影响 数据 库 管 理 员 和 企业 数据 专家 的 工作 的 。 当 然 ， 也 许 你 工作 的 公司 永远 不 会 破产 ， 但 你 
的 公司 可 能 会 由 于 法 律 法 规 、 经 营 状况 或 兼并 等 淘汰 一 些 应 用 程序 和 数据 。 


最 后 ， 当 应 用 程序 完成 它 的 使 命 时 ，DBA 要 确定 使 用 该 数据 的 应 用 程序 的 最 终 状 态 。 哪 些 数据 不 再 需要 了 ?其 他 的 应 用 程 


序 和 进程 也 使 用 这 些 数据 吗 ?是 否 有 规则 要 求 这些 数 据 存储 的 时 间 比 该 应 用 程序 长 ? 四 企业 是 否 有 任何 明确 的 隐私 政策 强调 了 
处 理 数据 的 特殊 规则 ? 


DBA 负 责 管理 整体 的 数据 库 环境 ， 通 常 包括 安装 DBMS 和 设置 IT 基 础 设施 ， 以 允许 应 用 程序 访问 数据 库 。 所 有 这 些 要 在 开发 
任何 应 用 程序 之 前 完成 。 除 此 之 外 ， 临 时 数据 库 访 问 也 是 许多 企业 的 需 


此 外 ，DBA 还 负责 临时 查询 环境 的 建立 ， 包 括 查询 和 报表 工具 的 评估 以 及 实施 ， 建 立 工 作 准 则 和 工作 流程 以 确保 临时 查询 
的 有 效 性 ， 以 及 监控 调 优 临时 SQL 语句 。 


如 你 所 见 ， 一 名 优秀 的 DBA 和 整个 应 用 程序 开发 生命 周期 融 为 一 体 。DBA 数 据 方 面 的 知识 以 及 利用 现代 化 的 应 用 程序 管理 
数据 的 方式 都 很 受 欢 迎 。 


优秀 的 DBA 和 整个 应 用 程序 开发 生命 周期 融 为 一 体 。 


DBA 生 涯 的 一 天 


DBA 生 涯 的 每 一 天 都 是 非常 忙碌 的 。 他 要 做 好 多 事情 : 不 仅 要 维护 生产 环境 和 测试 环境 ， 同 时 还 要 关注 现 有 的 应 用 程序 开 
发 项 目 ， 参 加 策略 和 设计 会 议 ， 帮 助 选择 和 评估 新 产品 ， 把 一 些 老 上 日 系统 联网 。DBA Joe 刚 才 提 交 了 “见鬼 的 查询 又 把 系统 搞 骨 
演 了 ， 你 又 能 怎么 样 呢 ? ”的 评论 。 所 有 这 些 对 于 DBA 来 说 都 可 能 在 同一 天 发 生 。 


置身 混沌 之 中 ，DBA 要 知道 所 有 事情 ， 从 技术 到 商业 术语 ， 再 到 最 新 的 管理 和 技术 的 热门 话题 ， 这 些 他 们 都 要 知道 。 没 有 
任何 私人 时 间 ，DBA 在 任何 时 候 都 要 做 好 准备 来 回答 任何 问题 ， 不 仪 是 关于 数据 库 的 。 


每 当 应 用 程序 出 现 问题 时 ， 人 们 总 是 首先 访 责 数据 库 环 境 。 数 据 库 “有罪 ， 且 除了 证 明 它 无 菲 之 外 别 无 他 法 。DBA 从 没有 
遇 到 过 某 个 应 用 程序 开发 人 员 过 来 请 教 : “这 里 的 SQL 我 用 得 很 糟糕 ， 你 能 帮忙 解决 吗 ? ”一 般 是 开发 人 员 疤 进 DBA 的 工 位 吃 
道 : “DB2 (或 者 指责 你 最 钟爱 的 DBMS) 有 个 问题 ， 你 为 什么 不 把 它 解决 掉 ， 那 样 我 很 炫 的 程序 就 能 跑 起 来 了 !“ 


应 用 程序 出 现 问 题 时 ， 数 据 库 是 “有 罪 的 ， 直 到 证 明 是 无 辜 的 ”。 


因此 ，DBA 不 得 不 去 证 明 那 个 问题 不 是 数据 库 引 起 的 。 他 必须 要 知道 信息 技术 的 方方面面 ， 在 他 所 设计 的 DBMS 和 数据 库 架 
构 中 跟踪 并 排除 错误 。 因 此 ， 他 不 仅 要 是 数据 库 技 术 方面 的 专家 ， 还 要 知道 和 DBMSs 关 联 的 所 有 IT 元 件 : 编程 语言 、 操 作 系统 、 
网 络 协 议和 网 络 产品 、 事 务 处理 器 、 能 想到 的 所 有 计算 机 硬件 ， 以 及 更 多 。 需 要 了 解 如 此 多 样 化 的 知识 ，DBA 也 就 成 了 非常 宝 
贵 的 资源 。 他 们 的 工作 也 变 得 有 趣 且 充满 挑战 。 


DBA 的 工作 是 没有 休息 的 。 数 据 库 程 序 是 全 天 候 运 行 的 ， 所 以 DBA 要 时 时 做 好 处 理 问 题 的 准备 。 DBA 大 多 随身 携带 呼 机 或 
手机 ， 保 证 随 传 随 到 。 如 果 数 据 库 在 凌晨 2 点 出 了 问题 ，DBA 也 要 从 床上 疏 起 来 清醒 一 下 就 去 解决 问题 ， 让 应 用 程序 重新 跑 起 
来 。 否 则 会 导致 数据 库 故 障 ， 有 可 能 导致 业务 流程 完全 终止。 


DBA 经 常 周末 都 坐 在 电脑 前 ， 在 数据 库 使 用 低谷 时 段 维护 并 重组 数据 库 。 早 上 9 点 到 下 午 5 点 期 间 维护 数据 库 ， 不 能 让 关键 
的 数据 库 停止 工作 。 坦 白 来 讲 ， 现 在 越 来 越 多 的 企业 都 是 24 小 时 工作 制 ， 昔 日 的 8 小 时 工作 制 已 经 成 为 神话 。 


如 果 这 对 你 还 有 吸引 力 ， 那 么 请 继续 往 下 读 。 实 际 上 ， 也 并 不 像 听 起 来 那么 糟 啦 。 这 项 工作 很 有 趣 ， 总 是 有 新 东西 可 以 学 ， 
并 且 如 前 面 提 到 的 ， 薪 水 也 不 错 。 问 题 是 ， 哪 个 人 能 20 年 甚至 更 多 年 一 直 做 这 种 工作 而 不 需要 休息 的 ?” 额 ， 我 好 像 听 到 你 手机 
响 了 ， 你 可 能 要 去 看 看 有 什么 事 了 。 


[1] http: //dataprivacyday2010.org/ 。 


[2] 法 规 对 数据 库 管 理 的 影响 在 第 15 章 有 深入 的 介绍 。 


1.4 评估 DBA 的 工作 邀请 


作为 DBA， 在 职业 生涯 中 多 次 换 工 作 几 乎 不 可 避免 。 每 当 要 换 新 工作 时 ， 显 然 你 都 会 考虑 好 多 方面 ， 如 薪资 、 奖 金 、 福 
利 、 调 薪 频 率 和 休假 时 长 。 你 还 应 该 考虑 那 家 公司 是 如 何 看 待 DBA 的 。 不 同 企业 对 DBA 的 定位 不 同 ， 寻 找 一 家 了 解 该 工作 的 复 
杂 性 并 一 直 学 习 该 职位 的 需求 的 进取 型 企业 对 你 的 职业 发 展 很 重要 。 


下 面 是 一 些 要 问 的 有 用 的 问题 : 


: 公司 会 为 DBA 提 供 常规 的 培训 ， 让 他 们 学 习 新 DBMS 的 特征 和 功能 吗 ? 技术 相关 的 培训 怎么 样 ? 比如， 编程、 网 络 、 电 子 
商务 、 事 务 管 理 、 信 息 队 列 等 。 


- 公司 允许 DBA 定 期 参加 本 地 用 户 组 吗 ? (1 每 年 的 远程 用 户 组 呢 ? 


- 有 备用 DBA， 还 是 你 会 是 一 天 24 小 时 或 一 周 7 天 待命 的 唯一 一 个 ? 
“ 是 否 有 数据 管理 和 系统 管理 组 织 ， 或 者 DBA 也 要 履行 所 有 这 些 职责 ? 
- DBA 组 会 把 应 用 程序 开发 团队 看 作 合作 伙伴 吗 ? 还 是 关系 比较 敌对 ? 
: DBA 参 与 设计 评审 、 预 算 讨论 以 及 其 他 高 级 IT 工 作 组 和 职务 吗 ? 

这 些 问 题 肯定 的 回答 越 多 ， 这 家 公司 DBA 的 工作 环境 就 越 先进 。 


[1] 即使 它们 发 生 在 工作 时 间 内 ? 


15 “数据库 管 理 、 数 据 管 理 和 系统 管理 


一 些 企业 分 别 为 数据 的 商业 方面 和 技术 方面 定义 了 不 同 的 角色 。 数 据 的 商业 方面 与 数据 管理 是 保持 一 致 的 ， 而 更 多 技术 方面 
都 由 数据 库 管理 掌控 。 并 不 是 每 一 家 企业 都 有 数据 管理 的 职位 ， 而 许多 企业 都 将 数据 管理 并 入 数据 库 管理 了 。 


许多 企业 都 将 数据 管理 并 入 了 数据 库 管理 。 


有 时 企业 也 将 数据 管理 的 技术 方面 进行 分 离 ，DBA 负 责 使 用 DBMS， 而 其 他 角色 (系统 管理 或 系统 编程 ) 负责 安装 并 升级 
DBMS, 


1.5.1 数据 管理 


数据 管理 (Data Administration, DA) 把 数据 资源 管理 的 商业 方面 和 用 于 数据 管理 的 技术 分 离开 。DA 存 在 于 一 家 企业 ， 
与 数据 的 实际 商业 用 户 联系 更 加 密切 。DA 团 队 负 责 理 解 商业 词汇 并 将 其 转换 成 逻辑 数据 模型 。 回 到 前 面 所 说 的 应 用 程序 开发 生 
命 周 期 ， 数 据 管 理 员 (DA) 会 更 多 地 参与 需求 收集 、 分 析 和 设计 阶段 。 而 DBA 参 与 设计 、 开 发 、 测 试 和 运作 阶段 。 


DA 和 DBA 的 另 一 个 有 区 别 因 素 是 他 们 工作 的 重点 。 DA 负责 以 下 问题 : 

. 确定 并 编写 商业 用 户 需要 的 数据 目录 ; 

. 概念 化 产品 并 逻辑 化 数据 模型 ， 准 确 描述 业务 流程 中 的 数据 元 素 之 间 的 关系 ; 
. 产生 企业 数据 模型 ， 它 要 整合 所 有 企业 /业务 流程 使 用 的 数据 ; 

. 为 企业 设置 数据 政策 ; 

. 确定 数据 拥有 者 和 管理 者 ; 

. 为 数据 的 控制 和 使 用 设置 标准 。 


总 之 ，DA 可 看 作 企业 的 首席 数据 官 。 尽 管 DA 的 职位 和 技术 没什么 特别 的 天 系 ， 但 依 我 看 来 ，DA 根 本 不 是 一 个 行政 职位 。 
实际 上 很 糟糕 ， 许 多 上 T 企 业 声称 它们 把 数据 看 作 公司 的 财产 ， 但 当 你 审视 它们 的 行为 时 便 会 发 现 此 声明 的 虚假 。 数 据 政策 的 责任 
常 移交 给 一 些 技术 专家 ， 但 他 们 不 能 专注 于 非 技术 性 的 、 商 业 方面 的 数据 管理 。 这 些 专 家 可 以 很 好 地 保证 数据 的 可 用 性 、 性 能 和 


可 恢复 性 ， 但 通常 不 能 保证 数据 的 质量 ， 也 不 能 设置 公司 的 数据 政策 。 
数据 管理 员 可 看 作 企业 的 首席 数据 官 。 


实际 上 ， 数 据 很 少 被 视 作 真正 的 企业 资产 。 看 看 每 家 企业 都 有 的 资产 吧 : 资金 、 人 力 资源 、 设 备 和 原材料 ， 每 一 种 都 是 模式 
化 的 : 账户 一 览 表 、 企 业 组 织 图 和 层次 报表 、 建 筑 蓝 图 和 办 公 室 布局 及 材料 账单 ， 每 一 种 都 可 跟踪 、 都 受 保护 。 企 业 还 请 来 专业 
会 计 师 确保 资产 账目 没有 任何 差 池 。 我 们 能 说 大 部 分 公司 也 这 样 对 待 数据 吗 ? 


一 个 成 熟 的 DA 组 织 负责 规划 并 指导 整个 企业 的 数据 使 用 需求 。 这 个 角色 围绕 数据 是 如 何 记录 、 共 享 和 实施 的 展开 工作 。DA 
的 一 个 很 大 的 责任 是 确保 将 数据 元 素 在 数据 字典 或 数据 存储 库 中 予以 准确 地 记录 。 这 是 DA 和 DBA 之 间 另 外 一 个 关键 区 别 ，DA 关 
注 存 储 库 ， 而 DBA 关 注 物理 数据 库 和 DBMS。 


此 外 ，DA 人 处 理 元 数据 ， 这 与 处 理 数据 的 DBA 截 然 相 反 。 元 数据 称 作 “数据 的 数据 ”， 更 准确 地 说 ， 元 数据 是 对 数据 和 业务 
所 需要 的 数据 的 描述 。 数 据 管理 负责 业务 和 元 数据 策略 。 


这 里 举 几 个 元 数据 的 例子 ， 它 可 以 包括 数据 元 素 的 定义 ， 某 个 数据 元 素 的 业务 名 称 ， 该 元 素 的 任何 缩写 形式 ， 该 元 素 的 数据 
类 型 及 长 度 。 没 有 了 元 数据 ， 数 据 就 难以 使 用 。 比 如 ， 数 字 12 是 个 数据 ， 但 是 什么 类 型 的 数据 呢 ? 换 句 话说 ，12 意 味 着 什么 ? 
没有 元 数据 我 们 就 无 从 知道 。 考 虑 下 面 几 个 问题 : 


. 这 是 代表 每 年 的 第 12 个 月 吗 ? 
. 代表 某 个 月 的 第 12 天 ? 
BRE? 

- 鞋 码 ? 

“ 是 一 个 IQ? 但 愿 不 是 如 此 。 

“ 其 他 


但 是 也 有 更 多 技术 方面 的 元 数据 ， 还 以 刚才 的 数字 12 为 例 : 


它 的 域 是 什么 ? (也 就 是 说 ，12 所 可 能 表示 的 单个 数值 属于 什么 领域 。) 
* 数据 类 型 是 怎样 的 ? 整 型 还 是 一 个 “有 零 刻度 ”的 十 进 制 数 ? 


元 数据 为 数据 提供 了 得 以 理解 的 上 下 文 ， 因 此 也 就 成 为 数据 的 信息 。 在 许多 企业 ， 元 数据 没有 系统 地 捕获 和 编目 ， 而 大 多 存 
在 于 商业 用 户 的 脑子 里 。 元 数据 在 系统 中 捕获 的 位 置 遍布 文件 定义 中 的 多 个 程序 ， 以 及 准确 性 参差 不 齐 的 文档 中 ， 或 长 时 间 不 用 
的 程序 定义 中 。 当 然 ， 其 中 一 些 位 置 在 DBMS 的 系统 目录 中 。 


元 数据 为 数据 提供 了 得 以 理解 的 上 下 文 ， 因 此 也 就 成 为 数据 的 信息 。 
综合 的 元 数据 策略 使 得 企业 知道 所 控制 的 资产 信息 并 衡量 这 些 资 产 的 价值 。 更 多 关于 元 数据 的 信息 请 参考 第 22 章 。 


DA 对 公司 数据 资产 的 最 大 贡献 之 一 是 创建 数据 模型 。 概 念 化 数据 模型 能 够 非常 高 水 平地 概括 出 数据 需求 。 逻 辑 化 数据 模型 
为 数据 类 型 、 长 度 、 关 系 及 基数 提供 了 深入 的 细节 。 DA 采用 标准 化 技术 提供 能 够 准确 描述 企业 的 数据 需求 的 完善 数据 模型 。 


很 多 DBA 会 把 数据 管理 当做 单纯 的 数据 模型 据 弃 ， 因 为 有 人 要 从 终端 用 户 那里 获得 数据 库 需 求 。 但 真正 的 DA 的 作用 远 不 只 


是 单纯 的 数据 模型 ， 而 是 一 种 面向 商业 管理 的 、 为 企业 数据 资产 服务 的 准则 。 


为 什么 在 一 本 关于 数据 库 管理 的 书 中 花 这 么 多 时 间 来 讨论 数据 管理 呢 ? 为 数 不 多 的 企业 实现 并 雇佣 了 DA。 企 业 做 得 越 大 ， 
越 有 可 能 设置 DA 职位 。 然 而 ， 当 一 家 企业 里 DA 的 角色 没有 确定 时 ，DBA 就 要 承担 数据 策划 与 建 模 的 职责 了 。 而 由 于 以 下 原 
因 ，DBA 通 常 不 能 够 承担 DA 所 有 的 职责 。 


- DBA 要 履行 许多 其 他 技术 方面 的 职责 ， 这 占用 了 他 大 部 分 的 时 间 。 

: DBA 团 队 的 经 理 一 般 没有 行政 职务 使 他 决定 策略 。 

* DBA 一 般 不 具备 与 商业 用 户 有 效 沟通 并 达成 共识 的 技巧 。 

“ 坦率 地 说 ， 大 部 分 的 DBA 更 愿意 处 理 技术 问题 及 与 技术 专家 打交道 ， 而 非 碰 触 业务 问题 及 非 技术 人 员 。 


当 DA 和 DBA 在 企业 共存 时 ， 这 两 个 团队 要 非常 密切 地 合作 。 当 然 ， 没 有 必要 要 求 他 们 有 共同 的 经 理 ， 不 过 若 有 ， 可 能 更 容 
易 促 进 他 们 的 合作 。 无 论 如 何 ， 重 要 的 是 两 个 团队 之 间 要 有 一 定 程度 的 技术 交流 。 因 为 DA 永远 不 会 像 DBA 那 样 了 解 物 理 数据 
库 ， 而 DBA 也 不 会 像 DA 那 样 了 解数 据 的 业务 问题 ， 每 种 工作 都 借鉴 其 他 工作 的 知识 就 会 更 有 效率 。 


总 之 ， 企 业 若 真 正 关心 数据 的 质量 、 完 整 性 和 再 利用 时 ， 都 会 安排 DA 的 职位 。 


15.2 ”数据 库 管 理 


数据 库 管理 是 整 本 书 的 重点 ， 本 节 就 不 伦 太 多 时 间 来 定义 它 了 。 本 书 以 后 的 部 分 会 给 出 详细 的 定义 。 本 节 将 快速 概括 当 DA 
也 存在 时 ，DBA 团 队 所 起 的 作用 。 如 图 1-3 所 示 ，DBA 管 理 数据 而 DA 管理 元 数据 ， 现 在 就 更 深入 了 解 一 下 吧 。 


元 数据 数据 


数据 管理 员 


概念 数据 逻辑 数据 ns 
异型 异型 物理 
= Pal 数据 库 
eee ee 


图 1-3 DBA 与 DA 


DBA 的 首要 职责 就 是 理解 DA 构建 的 数据 模型 并 能 够 与 应 用 程序 开发 者 以 及 其 他 相关 技术 人 员 讨论 该 模型 。 逻 辑 数据 模型 是 


DBA 用 来 创建 物理 数据 库 的 映射 。DBA 要 把 逻辑 数据 模型 转换 成 一 种 有 效 的 物理 数据 库 设 计 。 重 要 的 是 ，DBA 结 合 DBMS 中 用 
到 的 知识 ， 根 据 逻 辑 模型 创建 一 个 有 效 且 合适 的 物理 数据 库 设 计 。DBA 最 终 的 物理 模型 对 于 DA 的 依赖 不 会 比 DA 的 概念 和 逻辑 数 
据 模型 对 DBA 的 依赖 更 多 。 


DBA 是 DA 团队 与 技术 人 员 及 应 用 程序 编程 人 员 之 间 沟 通 的 桥梁 。 当 然 ，DBA 的 工作 大 多 是 对 基于 数据 库 的 物理 设计 创建 的 
数据 库 以 及 访问 这 些 数据 库 的 应 用 程序 的 持续 支持 。 有 关 这 些 职责 的 概述 会 在 1.6 节 展开 。 


DBA 是 DA 团队 与 技术 人 员 以 及 应 用 程序 编程 人 员 之 间 沟 通 的 桥梁 。 


1.5.3 ”系统 管理 


一 些 较 大 的 企业 会 设置 系统 管理 (SA) 或 系统 程序 设计 的 职位 ， 有 助 于 DBMS 的 实施 和 运行 。 当 SA 和 DBA 共 存 时 ，SA 负 责 
DBMS 的 安装 和 设置 。 他 们 一 般 不 负责 数据 库 的 设计 和 支持 。 而 DBA 负 责 数据 库 ，SA 负 责 DBMS 的 安装 、 修 改 和 支持 。 如 果 你 
不 清楚 这 种 区 别 ， 请 参阅 附录 人 A 中 数据 库 术 语 的 明确 定义 。 


此 外 ，SA 还 负责 IT 基础 设施 的 实施 ， 配 置 DBM 9 与 其 他 授权 系统 软件 一 起 运作 。SA 可 能 需要 和 其 他 技术 人 员 合 作 来 配置 事 
务 处 理 器 、 消 息 队列 、 软 件 、 网 络 协议 以 及 操作 系统 参数 ， 使 DBMS 有 效 地 运行 。 为 了 开发 数据 库 ，SA 还 要 通过 合理 地 设置 
DBMS， 向 DBMSs 供 应 商 申 请 持续 维护 ， 以 及 升级 DBM 版 本 来 确保 IT 基础 设施 正常 运作 。 


为 了 开发 数据 库 ， 系 统管 理 员 还 要 通过 合理 地 设置 DBMS ， 向 DBMS 供 应 商 申 请 持续 维护 ， 以 及 升级 DBMS 版 本 来 确保 IT 基 


础 设施 正常 运作 。 


与 DA 一 样 ，SA 和 DBA 之 间 也 要 交叉 培训 技能 。SA 永 远 都 不 会 像 DBA 那 样 了 解 物 理 数据 库 ， 但 DBA 也 不 太 可 能 像 SA 那 样 懂 
得 系统 软件 的 安装 以 及 它们 之 间 深 入 的 技术 关系 。 了 解 一 些 其 他 的 知识 ， 每 种 工作 都 能 更 有 效 地 发 挥 它 的 作用 。 


当 没有 独立 的 SA 团队 或 没有 专注 于 DBMS 的 SA 时 ，DBA 就 要 承担 系统 管理 和 编程 的 责任 了 。 图 1-4 中 对 DA、DBA 和 和 SA 的 职 


责 提供 了 简短 的 描述 。 


(类 而 设施 系统 管理 员 


(如 果 没 有 SA) 


(数据 和 元 数据 政策 数据 管理 员 | | 数据 库 管理 员 
(如 果 没有 DA) 


A 


E 


Pr 
\、 设计 


数据 库 管理 员 
( R 


(mit 


(实施 数据库， 应 用 程序， 


< 维护 和 调 优 


图 1-4 DA、DBA 和 SA 的 职责 


1.6 ”DBA 的 任务 


DBA 要 能 胜任 多 种 任务 以 保证 企业 的 数据 和 数据 库 是 有 用 的 、 可 用 的 、 有 效 的 、 正 确 的 。 任 务 包括 : 设计 、 性 能 监控 及 调 
节 、 保 证 有 效 性 、 授 权 的 安全 性 、 备 份 与 恢复 、 保 证 数据 的 完整 性 ， 还 有 和 公司 数据 有 关 的 一 切 。 下 面 逐 一 研究 。 


1.6.1 ”数据 库 设计 


人 们 认为 DBA 的 首要 任务 就 是 建立 设计 完美 的 数据 库 。 要 想 设 计 并 建立 合理 的 关系 数据 库 ，DBA 就 要 懂得 并 遵循 合理 的 关 
系 设计 原则 。 他 们 必须 要 懂得 相关 理论 及 用 于 建立 数据 库 的 RDBMS 的 具体 实施 细节 。 设 计数 据 库 要 充分 理解 概念 的 和 逻辑 的 数 
据 模 型 知识 。 具 备 建立 及 解释 实体 关系 图 的 能 力 对 于 设计 关系 数据 库 是 必 不 可 少 的 。 


此 外 ，DBA 要 能 够 把 逻辑 数据 模型 转换 成 物理 数据 库 。DBA 要 保证 设计 和 实施 的 数据 库 对 应 用 程序 及 使 用 它 的 客户 端 是 
用 的 。 


DBA 要 能 够 把 逻辑 数据 模型 转换 成 物理 数据 库 。 


数据 库 设 计 确 实 是 DBA 要 拥有 的 一 项 重要 技能 ， 而 DBA 的 工作 常 与 数据 库 设计 不 太 相 干 。 尽 管 设计 最 优 的 数据 库 很 重要 ， 
但 这 只 占据 DBA 工 作 相 当 小 的 一 部 分 。 相 比 最 初 的 设计 和 搭建 数据 库 ，DBA 在 管理 和 调整 数据 库 上 花费 的 时 间 有 可 能 更 多 。 


尽管 如 此 ， 你 绝 不 能 认为 数据 库 设 计 不 重要 。 一 个 糟糕 的 关系 设计 能 导致 糟 榜 的 性 能 ， 一 个 不 能 满足 企业 需求 的 数据 库 ， 在 
某 种 意义 上 就 是 错误 的 数据 库 。 


1.6.2 ”性 能 监控 和 调 优 


与 DBA 密 切 相 关 的 第 二 种 任务 是 性 能 监控 和 调 优 。 但 什么 是 数据 库 性 能 ? 暂且 用 我 们 熟悉 的 供需 概念 来 考虑 一 下 吧 ， 用 户 
对 于 数据 库 的 需求 信息 ，DBMS 对 这 些 需 求 所 提供 的 信息 。DBMS 提 供 信 息 需 求 的 速度 就 可 以 叫做 数据 库 性 能 。 但 不 会 那么 简 
单 ， 有 5 种 因素 可 以 影响 数据 库 性 能 : 工作 负载 、 吞 吐 量 、 资 源 、 优 化 和 竞争 。 


对 DBMS 请 求 的 工作 负载 (workload) 定义 了 需求 。 这 结合 了 在 线 交 易 、 批 量 作业 、 随 机 查询 、 数 据 仓库 、 分 析 查 询 ， 和 
在 任意 给 定时 间 内 直接 通过 系统 的 指令 。 工 作 负 载 可 以 每 天 、 每 小 时 、 每 分 钟 甚至 每 秒 钟 都 大 幅 波动 。 有 时 候 工 作 负载 是 可 以 预 
估 的 〈 比 如， 月底 大 量 的 结算 过 程 ， 或 下 午 七 点 半 大 部 分 用 户 下 班 后 对 数据 库 访 问 减少 ) ， 但 其 他 时 间 不 可 预 估 。 整 体 工 作 负载 
对 数据 库 性 能 有 着 重大 的 影响 。 


吞吐 时 定义 了 计算 机 硬件 和 软件 的 整体 能 力 。 这 整合 了 I/O 的 速度 、CPU 的 速度 、 机 器 的 并 行 能 力 、 操 作 系 统 及 系统 软件 的 
效率 。 由 系统 支配 的 硬件 和 软件 工具 称 为 “系统 资源 ”。 例 如 ， 数 据 库 内 核 、 磁 盘 空 间 、 高 速 缓存 控制 器 和 微 代 码 。 


数据 库 性 能 的 第 四 个 定义 元 素 是 优化 。 所 有 类 型 的 系统 都 可 以 优化 ， 但 在 这 些 优化 中 关系 查询 都 是 独特 的 ， 主 要 在 DBMS 内 
部 完成 。 然 而 还 有 许多 其 他 因素 有 待 优化 (SQL 表述 、 数 据 库 参 数 、 有 效 的 程序 设计 等 ) ， 从 而 使 数据 库 优 化 程序 能 够 创建 最 有 
效 的 访问 路 径 。 


当 对 某 一 特殊 资源 的 需求 (工作 负载 ) 很 高 时 ， 竞 争 就 产生 了 。 竞 争 产 生 的 条 件 是 : 两 个 或 多 个 工作 负载 元 件 试 图 以 一 种 冲 
突 的 方式 (例如 ， 对 同一 数据 段 进 行 双重 更 新 ) 使 用 单个 资源 。 随 着 竞争 的 增加 ， 吞 吐 量 随 之 降低 。 

因此 ， 数 据 库 性 能 可 以 定义 为 资源 利用 的 优化 以 增加 吞吐 量 并 减少 竞争 ， 从 而 最 大 可 能 地 处 理工 作 负 载 。 

数据 库 性 能 可 以 定义 为 资源 利用 的 优化 以 增加 吞吐 量 并 减少 竞争 ， 从 而 最 大 可 能 地 处 理工 作 负 和 载 。 


每 当 使 用 数据 库 的 应 用 程序 遇 到 | 问题 时 ，DBA 常 常会 首先 被 叫 过 来 解决 问题 。 当 然 ，DBA 不 能 和 凭空 管理 数据 库 性 能 。 应 用 
程序 会 定期 与 其 他 应 用 程序 、 系 统 和 IT 基础 设施 组 件 进 行 通信 。 一 种 有 效 的 性 能 监控 调整 策略 不 止 需要 DBMS 专 项 技术 ， 还 需要 
数据 库 管理 以 外 的 知识 。 许 多 性 能 管理 任务 需要 DBA 和 其 他 技术 专家 共同 完成 ， 换 句 话 说 ， 处 理性 能 问题 真 的 是 种 企业 范围 的 
努力 。 


DBA 要 在 监控 系统 、 数 据 库 和 应 用 程序 性 能 中 保持 警惕 ， 这 通过 自动 化 软件 和 脚本 可 以 尽 可 能 地 实现 。 轮 询 系统 表 并 构建 
基于 临界 值 的 警报 可 以 主动 识别 这 类 问题 。 当 性 能 指标 不 在 期 望 范围 内 时 ， 设 置 的 警报 可 以 发 送 电子 邮件 给 DBA。 


许多 任务 和 能 力 的 实现 都 要 求 DBA 要 保证 数据 库 的 有 效 访问 。 这 些 能 力 包 括 : 建立 恰当 的 索引 ， 指 定 足够 大 的 缓冲 区 和 高 
速 缓存 ， 使 数据 库 实现 和 IT 基础 设施 相符 ， 对 数据 库 和 应 用 程序 的 持续 监控 ,数据 库 重 构 ， 以 及 适应 业务 的 改变 (更 多 的 用 户 、 
更 多 的 数据 、 附 加 的 过 程 、 改 变 需求 和 规则 ) 。 


1.6.3 ”保证 可 用 性 

数据 和 数据 库 的 可 用 性 常 与 性 能 密切 相关 ， 但 实际 上 是 分 开 考虑 的 。 当 然 ， 如 果 DBMS 处 于 脱 机 状态 ， 性 能 表现 将 很 可 怕 ， 
因为 没有 数据 能 够 访问 。 但 保证 数据 库 的 可 用 性 是 个 多 方面 的 过 程 。 

保证 数据 库 的 可 用 性 是 个 多 方面 的 过 程 。 

可 用 性 的 第 一 要 素 是 要 保持 DBMS 持 续 运行 。 警 惕 监控 与 自动 警报 可 以 用 来 报告 DBMS 中 断 并 要 求 补救 措施 。 


个 人 数据 库 也 必须 维护 ， 使 得 其 中 的 数据 可 供应 用 程序 和 客户 端 调用 。 这 样 不 仅 需要 DBA 设 计数 据 库 ， 使 得 能 以 最 小 的 中 
断 去 维护 它 ， 还 要 帮助 设计 应 用 程序 ， 在 需要 并 发 访问 时 把 冲突 降 到 最 低 。 


可 用 性 的 另外 一 个 要 素 是 要 降低 执行 管理 任务 的 停机 时 间 。DBA 执 行 需要 数据 库 脱 机 的 管理 任务 越 快 ， 数 据 可 用 性 就 越 
强 。 越 来 越 多 的 DBMS 供 应 商 和 独立 软件 开发 商 (ISV) 提供 不 间断 的 实用 程序 ， 在 数据 库 上 执行 它们 ， 而 应 用 程序 通过 它们 对 
数据 库 进 行 读 写 。 但 这 些 通常 需要 更 多 的 技巧 和 前 期 规划 才能 实现 。 


DBA 必 须 了 解 所 有 这 些 方面 的 情况 ， 并 确保 每 个 应 用 程序 的 需求 都 接收 了 正确 等 级 水 平 的 可 用 性 。 


1.6.4 ”数据 库 安全 和 授权 
数据 库 一 旦 设计 好 并 部 署 ， 程 序 员 和 用 户 就 需要 访问 并 修改 数据 库 中 的 数据 。 但 为 防止 安全 漏 润 和 不 当 的 数据 修改 ， 只 有 得 
到 授权 的 程序 员 和 用 户 才能 够 访问 。DBA 的 职责 是 要 确保 数据 只 提供 给 授权 用 户 。 


尽管 并 不 尽 然 ( 详 见 “安全 的 集中 化 ”) ， 但 DBA 不 仅 要 与 DBMS 的 任意 组 授权 功能 打交道 ， 还 要 通过 “SQL 
GRANT” 和 “REVOKE” 语 句 与 DBMS 内 部 的 安全 功能 打交道 。 要 为 数据 库 环境 请 求 的 许多 行为 进行 安全 管理 : 


. 创建 数据 库 对 象 ， 包 括 数据 库 、 表 、 视 图 和 程序 结构 ; 
+ 变更 数据 库 对 象 的 结构 ; 

访问 系统 目录 ; 

- 读 取 并 修改 表 中 的 数据 ; 

* 创建 并 访问 用 户 定义 的 功能 和 数据 类 型 ; 

- 运行 存储 过 程 ; 

- 开始 并 停止 数据 库 ， 关 联 数 据 库 对 象 ; 


. 设置 并 修改 DBMS 参 数 和 说 明 ; 


. 运行 数据 库 实 用 程序 ， 如 LOAD、RECOVER 和 REORG。 


数据 库 安全 也 可 以 用 其 他 方式 强制 执行 ， 例 如 ， 创 建 视图 以 防止 敏感 的 列 与 行 被 终端 用 户 和 程序 员 查 看 。 当 外 部 的 安全 方法 
影响 数据 库 安全 时 ，DBA 也 经 常 和 这 些 安全 方法 打交道 。 


DBA 必 须 了 解 并 能 够 实施 影响 数据 库 访问 的 任何 安全 方面 。 他 们 应 该 特别 感 兴趣 的 一 个 领域 : SQL 注入 攻击 以 及 如 何 预防 ， 


HEE T AEB. 
DBA 必 须 了 解 影响 数据 库 访问 的 任何 安全 方面 。 
安全 的 集中 化 


一 些 企业 已 经 采取 措施 ， 将 所 有 的 安全 和 授权 任务 、 政 策 和 程序 ， 都 集中 在 一 个 IT 安全 组 。 这 并 不 容易 实现 ， 正 因为 如 此 ， 


相 比 规模 较 小 的 企业 ， 它 多 见于 较 大 型 的 企业 。 


到 严格 监管 的 行业 可 以 选择 集中 的 安全 操作 。 此 外 ， 拥 有 大 型 计算 机 的 企业 往往 比 那些 没有 大 型 计算 机 的 企业 更 倾向 于 集 


受 
中 安全 。 


要 成 功 地 将 数据 库 安 全 的 职责 从 数据 库 管 理 团 队 转 移 到 一 个 集中 的 安全 团队 ， 这 需要 给 安全 人 员 培 训 数 据 库 安全 有 关 的 技 
术 。 此 外 ， 许 多 商家 使 用 的 软件 从 DBMS 删 除了 一 些 安全 操作 ， 并 在 一 个 更 加 传统 的 安全 包 ( 比 如， 大 型 计算 机 上 的 RACF 或 
ACF2) 内 模仿 相同 的 功能 。 


即使 考虑 所 有 这 些 问 题 ， 大 多 数 的 企业 仍然 依赖 DBA 来 管理 数据 库 安 全 。 


1.6.5 “治理 与 合 规 性 
确保 符合 行业 和 政府 法 规 的 要 求 是 数据 库 管 理 的 一 项 附加 任务 ， 至 少 在 部 署 适 当 的 控制 方面 。DBA 必 须要 与 管理 人 员 、 审 
计 人 员 和 业务 专家 一 起 合作 来 了 解 适用 他 们 行业 的 法 规 及 处 理 数据 的 方式 。 


合 规 性 的 某 些 方面 是 天 于 标准 的 DBA 作 业 程 序 的 。 例 如 ， 法 规 可 能 包含 执行 特定 安全 和 授权 程序 使 用 的 语言 、 审 计 要 求 、 
数据 备份 规范 和 变更 管理 程序 。 然 而 ， 要 确保 合 规 可 能 需要 严格 的 文档 ， 或 者 更 高 程度 的 尽职 调查 或 自动 化 (比如 ， 更 深层 次 的 
审计 跟踪 ) 。 


合 规 性 的 其 他 方面 ， 可 能 需要 DBA 采 用 不 同 的 技术 、 战 术 和 技巧 。 例 如 ， 数 据 保 留 法 规 可 能 要 求 数据 在 使 用 后 仍 能 存储 在 
一 个 生产 数据 库 中 以 长 期 保留 ， 这 就 需要 数据 库 有 归档 的 能 力 ; 或 某 些 数据 可 能 需要 得 到 保护 以 免 被 查看 ， 这 就 需要 数据 屏蔽 ， 
或 在 某 些 情况 下 设置 数据 加 密 。 


DBA 不 应 该 负责 深入 地 理解 任何 法 规 ， 也 不 应 该 设置 企业 遵守 法 规 的 标准 。 然 而 ， 他 们 会 帮助 合 规 项 目 设置 适当 的 控制 及 
程序 ,特别 是 数据 处 理 方面 。 


DBA 为 数据 处 理 的 合 规 设置 适当 的 技术 控制 和 程序 。 


16.6 ”备份 和 恢复 


DBA 必 须 做 好 准备 在 问题 发 生 时 恢复 数据 。“ 问 题 ”可 能 意味 着 任何 系统 故障 或 程序 错误 或 者 一 场 自然 灾害 而 导致 一 家 企 
业 关 闭 。 现 在 ， 大 部 分 数据 恢复 是 应 用 软件 错误 和 人 为 错误 导致 的 ， 硬 件 故 障 并 不 像 从 前 那样 普遍 了 。 事 实 上 ， 分析 师 的 估计 表 
明 ，80% 的 应 用 程序 错误 是 由 于 软件 故障 及 人 为 错误 。 不 管 什么 原因 ，DBA 必 须 时 刻 准备 着 尽快 将 数据 恢复 到 一 个 可 用 的 点 。 


现在 ， 大 部 分 的 数据 恢复 是 应 用 软件 错误 和 人 为 错误 导致 的 。 


面 对 一 次 重大 停机 ， 通 常 想 到 的 第 一 种 数据 恢复 是 恢复 到 当前 。 数 据 恢复 的 最 终结 果 是 ， 该 数据 库 被 恢复 到 发 生 故 障 前 的 状 
态 。 在 恢复 完成 之 前 ， 应 用 程序 完全 不 可 用 。 


另 一 种 类 型 的 传统 数据 恢复 是 时 间 点 的 恢复 。 时 间 点 的 恢复 通常 用 来 处 理应 用 程序 级 别 的 问题 。 常 规 技术 执行 时 间 点 的 恢复 
将 删除 指定 的 时 间 点 以 后 的 所 有 交易 带 来 的 影响 。 如 果 在 该 时 间 范 围 内 一 些 有 效 的 交易 仍然 需要 ， 就 会 出 现时 间 点 后 的 交易 不 能 
恢复 的 问题 。 


事务 恢复 是 第 三 种 类 型 的 恢复 ， 解 决 了 传统 恢复 类 型 停机 时 间 和 有 效 数据 丢失 的 浆 端 。 因 此 ， 事 务 恢复 是 一 种 应 用 程序 恢 
复 ， 即 在 指定 时 间 内 删除 数据 库 中 特定 交易 所 带 来 的 影响 。 事 务 恢复 有 时 也 称 为 “应 用 程序 恢复 ”。 


大 多 数 技术 人 员 认 为 数据 恢复 是 为 了 解决 硬件 故障 等 灾害 。 虽 然 硬件 故障 仍 时 有 发 生 ， 但 技术 人 员 要 做 好 从 这 样 的 故障 中 恢 
复 的 准备 ， 当 今 大 多 数 数据 恢复 是 源 于 人 为 错误 或 程序 自 带 错 误 。 


DBA 必 须 准备 应 付 所 有 这 些 类 型 的 数据 恢复 。 这 涉及 制订 备份 策略 ， 以 确保 数据 在 软件 、 硬 件 或 手动 操作 的 错误 事件 中 不 
丢失 。 策 略 必须 适用 于 数据 库 处 理 ， 所 以 它 必须 包括 数据 库 文 件 的 映像 副本 以 及 数据 库 日 志 的 备份 /恢复 计划 。 它 需要 考虑 同样 
能 影响 数据 库 应 用 程序 的 任何 非 数据 库 文件 的 活动 。 


DBA 必 须 准 备 应 付 所 有 类 型 的 恢复 。 


1.6.7 ”确保 数据 完整 性 


数据 库 必须 能 够 以 正确 的 方式 存储 数据 并 且 不 会 使 数据 损坏 或 破坏 。 在 此 过 程 中 ，DBA 需 要 利用 DBMS 的 功能 实现 完整 性 规 
则 。 完 整 性 的 三 个 方面 和 数据 库 的 讨论 相关 : 物理 的 完整 性 、 语 义 的 完整 性 和 内 部 的 完整 性 。 


完整 性 的 三 个 方面 和 数据 库 的 讨论 相关 : 物理 的 完整 性 、 语 义 的 完整 性 和 内 部 的 完整 性 。 


物理 问题 可 以 使 用 DBMS 的 功能 ， 如 域 和 数据 类 型 处 理 。DBA 为 每 张 表 的 每 一 列 选择 适当 的 数据 类 型 。 此 操作 可 确保 只 有 该 
类 型 的 数据 存储 在 该 数据 库 中 ， 即 DBMS 强 制 执行 数据 类 型 的 完整 性 。A 列 定义 为 整 型 ， 则 该 列 只 能 包含 整数 。 试 图 在 定义 为 整 
型 的 列 中 存储 非 数 字 或 者 非 整 数值 都 将 失败 。DBA 也 可 以 使 用 约束 来 进一步 划 定 可 以 存储 在 数据 库 列 中 的 数据 类 型 。 大 多 数 相 
关 的 DBMS 产 品 提供 了 以 下 类 型 的 约束 : 


* 参照 约束 ， 用 于 指定 定义 了 表 之 间 的 任意 关系 的 列 。 参 照 约束 用 来 实现 参照 完整 性 ， 从 而 确保 一 张 表 的 一 列 数据 (或 一 组 
列 ) 的 所 有 预期 的 参考 ， 相 对 于 相同 或 不 同 表 的 另 一 列 中 的 数据 是 有 效 的 。 


* 唯一 约束 ， 确 保 表 中 的 一 列 或 一 组 列 的 值 只 出 现 一 次 。 


* 检查 约束 ， 用 来 在 表 中 的 一 列 或 一 组 列 中 放置 更 复杂 的 完整 性 规则 。 检 查 约束 通常 使 用 SQL 定 义 ， 并 可 以 用 来 定义 一 列 或 
一 组 列 允 许 的 数据 值 。 


语义 完整 性 更 加 难以 控制 且 不 易 定 义 。DBA 必 须 准备 要 执行 的 策略 和 方法 ， 以 确保 他 们 在 数据 库 中 存储 的 数据 是 准确 的 、 
合适 的 且 可 用 的 。 举 一 个 有 关 语 义 问题 的 例子 ， 如 数据 库 中 的 数据 的 质量 。 仅 存储 任何 符合 数据 库 定 义 的 物理 完整 性 的 数据 是 不 
够 的 ， 还 要 有 策略 和 方法 以 确保 数据 的 质量 。 例 如 ， 一 个 客户 数据 库 ， 其 中 25% 的 客户 数据 含有 错误 的 地 址 或 电话 号 码 ， 这 就 是 
一 个 质量 很 差 的 数据 库 。 没 有 系统 的 、 物 理 的 方法 保证 数据 的 准确 性 。 数 据 质量 要 通过 适当 的 应 用 程序 代码 、 健 全 的 商业 惯例 和 
特定 的 数据 政策 来 保证 。 匈 余 是 男 一 个 语义 问题 ， 如 果 在 整个 数据 库 中 数据 元 素 都 有 元 余 ，DBA 应 该 如 实 记 录 这 些 问题 并 找 出 
保证 元 余数 据 同 步 和 准确 性 的 方法 。 


完整 性 的 最 后 一 个 方面 是 DBMS 内 部 的 问题 。DBMS 依 赖 内 部 结构 和 代码 来 维护 链接 、 指 针 和 标识 符 。 在 大 多 数 情 况 
下 ，DBMS 会 很 好 地 维护 这 些 结构 ， 但 DBA 也 需要 知道 这 些 情况 ， 以 在 DBMS 失 败 时 知道 如 何 应 对 。 在 以 下 几 个 方面 ， 内 部 
DBMS 的 完整 性 是 必 不 可 少 的 : 


. 索引 的 一 致 性 。 索 引 是 数据 库 表 中 数据 的 有 序 指针 列表 。 如 果 由 于 某 种 原因 ， 索 引 与 数据 不 同步 ， 索 引 访问 可 能 无 法 返回 
正确 的 数据 。DBA 有 检查 和 纠正 这 些 类 型 错误 的 工具 。 


* 指针 的 一 致 性 。 有 时 大 型 多 媒体 对 象 并 没有 和 其 他 数据 一 起 存储 在 同一 个 物理 文件 中 。 因 此 ，DBMS 需 要 指针 类 型 的 结 
构 ， 以 保持 基 表 数据 与 多 媒体 数据 同步 。 强 调 一 下 ， 如 果 不 遵守 适当 的 管理 程序 ， 这 些 指针 可 能 会 不 同步 。 


* 备份 的 一 致 性 。 有些 DBMS 产 品 偶尔 会 接收 不 恰当 的 备份 副本 ， 实 际 上 这 些 副 本 对 恢复 作用 不 大 。 关 键 是 要 识别 这 些 情 
况 ， 并 采取 相应 改正 措施 。 


总 而 言 之， 确保 数据 完整 性 是 DBA 的 一 项 必 不 可 少 的 技能 。 


1.7 DBMS 版 本 迁移 


DBA 也 负责 管理 DBMS 的 版 本 迁移 ，DBMS 产 品 变更 相当 频繁 ,通常 每 年 都 会 有 新 版 本 发 布 。 保 持 DBMS 运 行 和 更 新 是 一 项 
寺 续 的 工作 ， 将 占据 DBA 工 作 的 大 部 分 时 间 。 要 降低 停机 几率 和 减少 应 用 程序 需求 变化 ， 无 论 采 用 何 种 方法 都 必须 与 企业 的 需 
求 相 符 。 


保持 DBMS 运 行 和 最 新 是 一 项 持续 的 工作 ， 将 占据 DBA 工 作 的 大 部 。 


多 面 手 

数据 库 是 现代 应 用 程序 的 核心 ， 如 果 DBMS 失 败 ， 应 用 程序 随 之 失败 ， 进 而 整个 业务 也 被 迫 停 止 ;如 果 数 据 库 和 应 用 程序 经 
常 失败 ， 整 个 业务 也 可 能 会 失败 。 因 此 数据 库 管 理 员 对 现代 商业 的 持续 成 功 至 关 重 要 。 

此 外 ， 几 乎 IT 基础 设施 的 每 一 个 组 成 部 分 都 与 数据 库 交 互 ， 当 今 的 上 基础 设施 包括 : 

- 编程 语言 和 环境 ， 如 COBOL、Microsoft Visual Studio. C/C++/C#, JavafePHP; 

- 软件 框架 ， 如 .NET 和 J2EE; 


- 数据 库 和 流程 设计 工具 ， 如 ERwin 和 Rational Rose; 


- 事务 处 理 系统 ， 如 CICS 和 Tuxedo; 
- 应 用 程序 服务 器 ， 如 WebSphere、JBoss、Otacle Application Server#eHAServer; 
. 消息 队列 软件 ， 如 MQSeries 和 MSMQ; 


“ 网 络 软件 和 协议 ， 如 SNA、VTAM 和 TCP/IP; 


“ 网 络 硬件 ， 如 网 桥 、 路 由 器 、 集 线 器 和 布线 ; 


- 多 种 操作 系统 ， 如 Windows、z/OS 和 MVS、UNIX 和 Linux， 以 及 其 他 系统 ; 

数据 存储 硬件 和 软件 ， 如 企业 级 存储 服务 器 、Mictosoft SMS, IBM DFHSM、SAN 和 NAS; 
- 操作 系统 安全 包 ， 如 RACF、ACF2 和 Kerberos; 

“ 其 他 类 型 的 存储 硬件 ， 如 磁带 机 、 料 仓 和 固态 存储 (内存) ; 

非 DBMS 数 据 设置 和 文件 存储 技术 ， 如 VSAM 和 b-tree; 

- NoSQL 产 品 ， 如 Hadoop 和 MongoDB; 

- 数据 库 管理 工具 以 及 它们 如 何 与 其 他 系统 管理 解决 方案 交互 ; 

- 系统 管理 工具 和 框架 ， 如 HP OpenView 和 CA Unicenter; 

- 操作 控制 软件 ， 如 batch 调 度 软件 和 作业 控制 子 系统 (Job Entry Subsystem, JES) ; 

“ 在 整个 网 络 中 实现 系统 软件 新 版 本 的 软件 分 布 解决 方案 ; 

. 互联 网 和 基于 Web 的 数据 库 和 应 用 程序 ; 

- C/S 开 发 技术 (多 层 式 、 胖 服务 器 / 瘦 客 户 端 、 瘦 服务 器 / 胖 客 户 端 等 ) ; 

- 面向 对 象 和 基于 组 件 的 开发 技术 /技能 ， 如 CORBA、COM、OLE/DB、ADO 和 EJB; 
普遍 计算 技术 设备 ， 如 平板 电脑 和 智能 手机 。 


尽管 要 成 为 所 有 这 些 技术 的 专家 不 太 可 能 ,但 是 DBA 也 应 该 了 解 这 些 领 域 的 知识 ， 以 及 它们 是 如 何 关 联 的 。 更 重要 的 
是 ，DBA 要 有 那些 专家 的 电话 号 码 ， 以 防 任何 一 种 相关 的 软件 和 硬件 导致 数据 库 访问 或 性 能 出 问题 。 


1.8 DBA 的 类 型 


有 些 DBA 专 注 于 逻辑 设计 ， 有 些 则 专注 于 物理 设计 : 专注 于 搭建 系统 的 DBA 以 及 专注 于 维护 和 调整 系统 的 DBA; 专业 的 
DBA 和 通用 的 DBA。 诚 然 ，DBA 的 工作 包含 了 许多 角色 。 


一 些 企业 选择 将 DBA 的 职责 细 分 成 独立 的 工作 。 当 然 ， 这 大 多 是 在 较 大 的 企业 ， 较 小 的 企业 往往 付 不 起 请 多 个 专业 的 DBA 
的 费用 。 


还 有 一 些 公司 干脆 雇佣 DBA 来 执行 所有 的 任务 : 设计 、 创 建 、 归 档 、 调 整 及 维护 公司 的 数据 、 数 据 库 、 数 据 库 管理 系统 。 
下 面 介绍 一 些 比较 常见 类 型 的 DBA。 


1.8.1 系统 DBA 


系统 DBA 专 注 于 技术 而 不 是 业务 问题 。 


特别 是 在 系统 管理 领域 ， 系 统 DBA 专 注 于 技术 而 不 是 业务 问题 。 典 型 任务 主要 是 DBMSs 软 件 的 物理 安装 和 性 能 ， 包 括 : 
安装 新 版 本 的 DBMS 并 应 用 DBMS 供 应 商 提 供 的 维护 补丁 ; 


. 设置 并 调节 系统 参数 ; 


: 调节 操作 系统 、 网 络 和 事务 处 理 器 ， 使 它们 与 DBMS 协 同 合作 ; 
- 确保 DBMS 的 适当 存储 ; 

- 使 DBMS 与 存储 设备 和 存储 管理 软件 协同 工作 ; 

“ 配合 数据 库 应 用 程序 所 需要 的 其 他 技术 ; 

- 安装 DBA 工 具 和 实用 程序 。 


系统 DBA 很 少 参 与 数据 库 和 应 用 程序 的 实际 部 署 。 当 操作 系统 参数 或 复杂 的 DBMS 参 数 需要 修改 时 ， 他 们 可 能 会 参与 应 用 程 
序 的 调 优 。 


事实 上 ， 通 常 只 有 在 企业 没有 真正 的 系统 管理 员 或 系统 程序 部 门 的 情况 下 ， 系 统 DBA 才 存在。 


1.8.2 数据库 架构 师 
一 些 企业 为 设计 和 部 署 新 数据 库 设 立 了 一 个 单独 的 职位 ， 简 称 数据 库 架 构 师 。 数 据 库 架构 师 只 参与 新 的 设计 和 开发 工作 ， 不 
参与 搭建 数据 库 及 应 用 程序 的 维护 、 管 理 和 调 优 工作 。 数 据 库 架 构 师 为 新 应 用 程序 或 者 现 有 的 应 用 程序 设计 新 的 数据 库 。 


数据 库 架 构 师 只 参与 新 的 设计 和 开发 工作 。 


设立 这 样 一 个 单独 的 职位 是 由 于 设计 新 数据 库 所 需要 的 技能 和 维持 现 有 的 数据 库 运 行 的 技能 有 所 不 同 。 数 据 库 架 构 师 的 数据 
管理 和 建 模 技术 可 能 比 通用 DBA 更 专业 ， 因 为 DA 技能 在 初始 数据 库 设计 时 更 加 有 用 。 


数据 库 架 构 师 的 典型 工作 包括 : 

创建 逻辑 数据 模型 (如 果 没 有 DA 或 数据 建 模 师 ) 。 
o 将 逻辑 数据 模型 转换 为 物理 数据 库 设 计 。 
: 部署 有 效 的 数据 库 ， 包 括 物理 特性 、 索 引 设计 和 映射 数据 库 对 象 到 物理 存储 设备 。 
-分析 数据 访问 和 修改 需求 ， 确 保 SQL 的 高 效 性 以 及 最 佳 的 数据 库 设计 。 
为 新 的 数据 库 创建 备份 和 恢复 策略 。 


大 多 数 企业 都 不 会 安排 单独 的 数据 库 架 构 师 职位 ， 而 是 要 求 DBA 兼 顾 新 的 和 已 有 的 数据 库 项 目 。 


1.8.3 数据库 分 析 师 


另 一 种 常见 的 职位 是 数据 库 分 析 师 。 数 据 库 分 析 师 根本 没有 一 个 通用 的 定义 ， 有 时 高 级 DBA 称 作 数据 库 分 析 师 ， 有 时 与 数 
据 库 架 构 师 所 做 工作 类 似 ， 有 时 DA 要 扮演 数据 库 分 析 师 或 数据 分 析 师 ， 有 时 数据 库 分 析 师 只 是 一 些 企业 对 数据 库 管 理 员 的 另 一 
种 称呼 。 


1.8.4 ”数据 建 模 师 


没有 定义 或 配备 DA 角色 时 ， 可 能 会 定义 一 个 数据 建 模 师 。 数 据 建 模 师 通常 负责 部 分 DA 工作 ， 数 据 建 模 的 任务 包括 : 
* 为 开发 项 目 收集 数据 需求 ; 

.分析 数据 需求 ; 

* 设计 基于 项 目的 概念 和 逻辑 数据 模型 ， 

+ 建立 企业 的 数据 模型 并 随时 更 新 ; 


- 与 DBA 合 作 ， 以 确保 他 们 充分 了 解 该 数据 模型 。 


1.8.5 ”应 用 程序 DBA 


与 系统 DBA 直 接 对 比 的 是 应 用 程序 DBA。 应 用 程序 DBA 专 注 于 数据 库 的 设计 和 管理 ， 以 及 对 特定 的 一 个 或 多 个 应 用 程序 的 
寺 续 支持 。 应 用 程序 DBA 可 能 擅长 编写 和 调试 复杂 的 SQL 语 句 ， 并 慌 得 在 应 用 程序 中 做 数据 库 请 求 的 最 佳 方 式 。 他 们 还 必须 能 
执行 数据 库 的 变更 管理 、 性 能 调 优 以 及 DBA 的 大 多 数 其 他 工作 。 所 不 同 的 是 ， 应 用 程序 DBA 天 注 应 用 程序 的 特定 子 集 ， 而 非 整 
个 DBMS 的 部 署 和 数据 库 环 境 ( 详 见 图 1-5) 。 


应 用 程序 DBA 专 注 于 数据 库 的 设计 和 管理 ， 以 及 对 特定 的 一 个 或 多 个 应 用 程序 的 持续 支持 。 


并 非 每 个 企业 都 配备 了 应 用 程序 DBA。 有 该 职位 时 ， 通 用 DBA 仍 需要 支持 数据 库 的 整体 环境 和 基础 设施 ; 没有 该 职位 时 ， 
通用 DBA 很 可 能 在 维护 企业 数据 库 环 境 的 同时 还 要 支持 特定 应 用 程序 。 
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图 1-5 ”应 用 程序 DBA 的 关注 点 
有 人 赞成 配备 应 用 程序 DBA， 也 有 人 反对 。 赞 成 的 理由 如 下 : 
* 应 用 程序 DBA 可 以 更 好 地 专注 于 单个 应 用 程序 ， 这 就 可 以 更 好 地 服务 于 该 程序 的 开发 人 员 。 
` 应 用 程序 DBA 常 被 视 作 开发 团队 不 可 分 割 的 部 分 ， 因 此 可 以 更 好 地 了 解 新 的 开发 计划 以 及 计划 的 改变 。 


事 于 某 些 特定 的 应 用 程序 ， 他 们 可 以 更 好 地 把 握 每 个 应 用 程序 运行 的 状况 ， 从 而 可 以 给 开发 人 


- 因为 应 用 程序 DBA 一 直 从 事 
员 更 好 的 支持 。 


有 了 对 应 用 程序 的 全 面 了 解 ， 应 用 程序 DBA 会 更 好 地 理解 应 用 程序 是 如 何 影响 整体 业务 的 。 这 方面 的 知识 更 有 助 于 他 们 


为 企业 提供 更 好 的 支持 。 
但 并 不 是 所 有 人 都 支持 应 用 程序 DBA， 反 对 的 理由 如 下 : 
" 由 于 应 用 程序 DBA 只 专注 于 单个 应 用 程序 ， 他 们 可 能 会 忽视 企业 整体 的 数据 需求 。 
“ 缺乏 与 集中 的 DBA 团 队 的 沟通 导致 技能 共享 减少 ， 应 用 程序 DBA 会 变 得 孤立 。 
- 应 用 程序 DBA 实 现 有 用 的 程序 (procedure) 时 ， 需 要 付出 更 多 的 努力 和 其 他 DBA 分 享 。 
- 应 用 程序 DBA 以 应 用 程序 为 中 心 ， 他 们 可 能 会 忽视 DBMS 团 队 交 付 的 新 特性 和 功能 。 


一 般 情 况 下 ， 配 备 了 应 用 程序 DBA， 也 一 定 要 配备 一 个 集中 的 DBA 团 队 。 应 用 程序 PDBA 虽 然 主要 负责 特定 的 应 用 程序 ， 也 
应 该 被 视 作 集中 的 DBA 团 队 的 一 员 。 这 样 将 会 发 挥 应 用 程序 PDBA 的 正面 作用 ， 同 时 打消 其 负面 作用 。 


配备 了 应 用 程序 DBA， 也 一 定 要 配备 一 个 集中 的 DBA 团 队 。 


1.8.6 面向 任务 的 DBA 
较 大 的 企业 有 时 会 有 专注 于 基 个 特定 任务 的 专门 的 DBA。 但 面向 任务 的 DBA 在 较 小 的 IT 企业 里 很 少 存在 ， 他 们 整 天 致力 于 确 
保 企业 数据 库 的 备份 和 恢复 。 


大 多 数 企业 都 无 法 负担 这 种 水 平 的 DBA， 但 如 果 可 能 ， 则 能 确保 重要 的 任务 都 有 专人 处 理 。 


1.8.7 ”性 能 分 析 师 


性 能 分 析 师 是 一 种 典型 的 面向 任务 的 DBA。 比 其 他 面向 任务 的 DBA 更 常见 的 是 ， 性 能 分 析 师 只 专注 数据 库 应 用 程序 的 性 


性 能 分 析 师 必须 了 解 SQL 性 能 编码 的 细节 和 微妙 之 处 ， 以 及 有 能 力 设计 数据 库 的 性 能 。 性 能 分 析 师 在 技术 层面 非常 了 解 在 用 
的 DBMS， 从 而 能 够 在 需要 时 对 DBMS 和 系统 参数 作出 适当 的 改变 。 


但 性 能 分 析 师 不 应 该 是 一 个 系统 DBA。 性 能 分 析 师 能 够 和 程序 开发 人 员 有 效 沟通 ， 从 而 帮助 他 们 为 了 得 到 更 好 的 性 能 而 相 
应 地 改变 程序 。 


性 能 分 析 师 通常 是 技艺 精湛 的 DBA 高 级 成 员 。 成 为 一 名 高 级 DBA 很 有 可 能 归结 于 他 的 经 验 以 及 在 以 往 的 调 优 工作 中 获得 的 
尊重 。 


性 能 分 析 师 通常 是 技艺 精湛 的 DBA 高 级 成 员 。 


18.8 ”数据 仓库 管理 员 


企业 为 了 进行 深入 数据 分 析 而 部 署 数据 仓库 ， 通 常会 特别 配备 DBA 来 监控 并 支持 数据 仓库 环境 。 数 据 仓 库 管理 员 必 须 是 有 
能 力 的 DBA， 并 且 完 全 了 解 支持 在 线 事务 处 理 (OLTP) 的 数据 库 与 数据 仓库 之 间 的 差别 。 常 见 的 数据 仓库 管理 员 的 任务 和 需求 
包括 : 


` 使 用 商业 智能 、 数 据 分 析 、 查 询 和 报表 工具 ， 


只 读 访问 权限 的 数据 库 设 计 ; 


* 数据 仓库 的 设计 事务 ， 如 星 型 模式 ; 


. 数据 仓库 技术 ， 如 联机 分 析 处 理 或 OLAP (包括 ROLAP、MOLAP 和 HOLAP) ; 


+ 数据 变换 和 转换 技能 ; 


:了解 数据 质量 问题 ; 


.处理 用 于 加 载 和 务 载 数据 的 数据 格式 ; 


“ 中 间 件 的 实施 和 管理 人 员 注 意 事项 。 


1.9 ”人员 配 备 的 考虑 


配备 DBA 不 是 一 件 简单 的 事情 ， 有 几 个 有 待 解决 的 重要 的 考虑 ， 包 括 DBA 人 员 的 规模 和 DBA 报 告 结构 的 规模 。 


1.9.1 需要 多 少 DBA 


最 难 确定 的 事情 之 一 是 保证 企业 数据 库 在 线 并 高 效 运作 的 DBA 的 最 佳 数 量 。 许 多 企业 都 试图 将 DBA 人 员 规 模 降 到 最 低 ， 本 
想 着 人 员 减 少 了 成 本 就 降低 了 ， 但 这 种 假设 一 般 是 不 正确 的 。 一 个 过 度 劳累 的 DBA 可 能 会 犯错 ， 而 导致 的 停机 时 间 和 操作 问题 
的 成 本 远 远 超过 一 个 额外 的 DBA 的 薪资 成 本 。 


但 确定 DBA 的 最 佳 数量 不 是 一 门 精 确 的 科学 ， 它 取决 于 多 种 因素 ， 包 括 : 


. 数据 库 的 数量 。 需 要 支持 的 数据 库 越 多 ， 数 据 库 管理 的 工作 就 越 复杂 。 每 一 个 数据 库 都 需要 设计 、 部 署 、 监 控 可 用 性 和 性 
能 、 备 份 以 及 管理 。 而 一 名 DBA 能 够 控制 的 数据 库 数 量 是 有 限 的 。 


: 用 户 数量 。 随 着 更 多 的 用 户 联机 作为 访问 数据 库 应 用 程序 的 客户 端 ， 确 保 数据 库 的 最 佳 性 能 变 得 更 加 困难 。 此 外 ， 随 着 用 
户 量 的 增加 ， 问 题 量 与 调用 量 增加 的 可 能 性 也 随 之 增加 ， 进 而 增加 了 DBA 工 作 的 复杂 性 。 


* 应 用 程序 的 数量 。 一 个 单一 的 数据 库 能 被 多 个 应 用 程序 使 用 ， 实 际 上 ，DBMS 的 主要 好 处 之 一 是 使 数据 可 以 在 整个 企业 内 
共享 。 随 着 更 多 的 应 用 程序 联机 ， 对 数据 库 的 性 能 、 可 用 性 和 需要 的 资源 等 方面 都 施加 了 压力 ， 相 同 数量 的 数据 库 可 能 需要 更 多 
的 DBA 来 支持 。 


- 服务 水 平 协议 (SLA) 。SLA 越 严格 ，DBA 越 难 提供 满意 的 服务 。 例 如 ， 需 要 1 秒 响 应 时 间 的 SLA 比 需要 3 秒 响应 时 间 的 
SLA 更 加 难以 支持 。 


“ 可 用 性 需求 。 当 数据 库 具有 可 允许 的 计划 停机 时 间 时 ， 数 据 库 管理 就 变 得 更 加 容易 ， 因 为 一 些 DBA 任 务 要 么 需要 中 断 运 
AF, 要 么 在 中 断 时 更 加 容易 进行 。 一 些 考 虑 (诸如 要 支持 电子 商务 交易 和 网 络 ) ， 推 动 了 对 24/7 数 据 库 可 用 性 的 需求 。 


: 停机 时 间 的 影响 。 数 据 库 不 可 用 对 财务 的 影响 越 大 ，DBA 就 越 困 难 ， 因 为 有 人 会 施加 压力 以 确保 数据 库 更 佳 的 可 用 性 。 
` 性 能 需求 。 随 着 对 数据 库 的 访问 需求 变 得 更 加 面向 性 能 、 更 加 快速 ， 而 要 求 的 访问 也 更 加 频繁 ，DBA 变 得 更 加 复杂 。 


* 应 用 程序 的 类 型 。 企 业 部 署 各 种 类 型 的 应 用 程序 ， 必 须要 支持 的 应 用 程序 的 类 型 对 需要 什么 DBA 服 务 有 所 影响 。DBMS 和 
数据 库 对 关键 任务 的 应 用 程序 的 需求 与 对 非 关 键 任 务 的 应 用 程序 的 需求 是 不 同 的 。 关 键 任 务 的 应 用 程序 可 能 更 需要 持续 地 监控 和 
更 多 的 警惕 ， 以 确保 其 可 用 性 。 同 样 ，OLTP 应 用 程序 与 OLAP 应 用 程序 会 有 不 同 的 特点 及 管理 需求 。OLTP 处 理事 务 的 时 间 可 能 
比 OLAP 查 询 时 间 更 短 ; OLTP 应 用 程序 执行 读 取 和 写 入 操作 ， 而 OLAP 应 用 程序 通常 只 有 读 取 操 作 。 每 种 应 用 程序 都 有 管理 挑 
战 ， 都 施加 了 不 同 的 DBA 程 序 与 需求 。 


* 波动 性 。 数 据 库 变更 需求 的 频率 是 需要 额外 的 DBA 与 否 的 重要 因素 。 一 个 很 少 需 要 变更 的 静态 数据 库 环境 ， 与 一 个 不 稳 
定 的 、 经 常 变更 的 数据 库 环 境 需 要 DBA 付 出 的 努力 是 不 同 的 。 这 憾 的 是 ， 大 多 数据 库 和 应 用 程序 波动 性 水 平 往 往 会 随 着 时 间 的 
推移 发 生 巨大 的 变化 。 很 难 确定 整体 的 数据 库 环 境 将 在 其 生命 周期 内 如 何 波 动 。 


- DBA 人 员 的 经 验 。 现 有 DBA 人 员 的 技能 将 对 是 否 还 需要 额外 的 DBA 产 生 影响 。 一 名 技术 娴熟 的 DBA 人 员 能 够 做 到 的 要 比 
一 个 新 手 团队 多 。 且 技能 比 经 验 更 能 决定 所 需要 的 DBA 人 员 的 水 平 。 一 名 有 两 年 工作 经 验 的 、 非 常 积极 的 DBA 可 能 轻松 超过 一 
名 具有 十 年 工作 经 验 却 筋疲力尽 、 无 心 工 作 的 老手 。 


开发 人 员 的 经 验 。 从 事 数据 库 和 SQL 编程 的 开发 人 员 越 不 熟练 ， 在 开发 过 程 、 执 行 复杂 的 SQL 任务 、 分 析 、 调 试 、 调 优 、 
确保 连接 性 中 需要 DBA 人 员 介 入 的 就 越 多 。 随 着 开发 人 员 经 验 的 增加 ，DBA 工 作 的 复杂 性 也 相应 减少 。 


* 终端 用 户 经 验 。 当 终端 用 户 试 图 通过 随机 SQL 语句 直接 访问 数据 库 时 ， 他 们 的 技能 水 平 将 直接 影响 DBA 工 作 的 复杂 性 。 


. DBA 工 具 。DBMS 供 应 商 和 为 数 不 少 的 ISV 都 提供 自动 执行 DBA 任 务 的 工具 ， 从 而 使 得 管理 数据 库 变 得 更 容易 。 工 具 的 可 
用 性 越 高 且 介 入 度 越 深 ，DBA 的 工作 将 会 变 得 越 简单 。 行 业 分 析 师 预 估 一 旦 没有 了 DBA 工 具 ，DBA 的 需求 量 将 两 倍 于 现在 的 数 
目 。 


确定 需要 的 DBA 数 量 不 是 一 门 精确 的 科学 。 


尽管 罗列 了 以 上 复杂 的 问题 ， 但 要 想 把 所 有 这 些 因 素 都 合并 成 一 个 公式 而 得 出 需要 雇佣 的 DBA 最 佳 数 量 还 是 非常 困难 的 。 
尽管 研究 或 许 有 些 过 时 ， 但 META 集 团 中 的 行业 分 析 师 还 是 创造 了 一 个 宽松 的 公式 计算 DBA 努 力 的 水 平 (Level of 
Effort, LOE) 。 公 式 并 不 严谨 ， 但 是 通过 六 种 因素 得 出 DBA LOE: 系统 复杂 性 、 应 用 程序 不 成 熟 度 、 终 端 用 户 水 平 参差 不 齐 、 
软件 功能 、 系 统 可 用 性 和 人 员 不 成 熟 度 。 通 过 尽 可 能 地 评估 表示 每 种 因素 高 或 低 的 分 值 ， 将 这 些 值 代入 公式 得 出 一 个 数字 ， 再 将 
该 数字 转换 成 所 需 的 DBA 数 量 的 预 估 。 


创造 一 个 能 够 得 出 需要 雇佣 的 DBA 最 佳 数 量 的 公式 非常 困难 。 


[1] META 集 团 于 2004 年 被 Gartnet 公 司 收购 ， 如 果 该 集团 过 时 的 研究 报告 仍然 可 用 ， 那 么 将 可 通过 Gartnet 公 司 获 得 。META 集 团 的 
研究 报告 于 1998 年 3 月 20 日 发 布 (开放 计算 与 服务 器 策略 ， 文 件 : 656) 。 


1.9.2 ”DBA 报告 结构 


在 企业 里 ，DBA 团 队 应 当 向 谁 报告 呢 ? 不 同 的 企业 采取 了 不 同 的 DBA 报 告 结构 ， 但 有 些 报告 阶梯 是 通用 的 。 恐 怕 没 有 人 能 
说 出 哪 种 报告 结构 优 于 其 他 。 下 面 看 一 下 几 种 可 能 的 结构 。 


最 好 的 结构 之 一 是 创建 一 个 数据 资源 管理 组 (DRM) ， 囊 括 企业 所 有 的 数据 和 信息 专家 一 DA、DBA、 数 据 分 析 师 和 性 能 
分 析 师 等 。 这 个 组 通常 直接 向 CIO 报 告 ， 但 也 可 能 通过 一 个 系统 编程 单元 、 数 据 中 心 或 技术 支持 来 间接 向 CIO 报 告 。 图 1-6 描 述 
了 这 种 典型 的 报告 结构 。 
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图 1-6 ”典型 的 DBA 报 告 结构 


当 一 家 企业 设置 了 应 用 程序 DBA 时 ， 他 们 会 分 散 到 各 应 用 程序 团队 ， 通 常 直 接 向 业务 程序 经 理 报告 。 每 一 个 应 用 程序 开发 
团队 都 有 一 名 专门 的 应 用 程序 DBA， 如 图 1-7 所 示 。 
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图 1-7 应 用 程序 DBA 的 报告 结构 


尽管 如 此 ， 这 两 种 报告 结构 都 有 些 问 题 。 第 一 个 问题 就 是 DRM 应 当 放 到 IT 报告 阶梯 的 更 高 位 置 ， 比 如 ， 让 DRM 直 接 向 CIO 
报告 就 是 个 不 错 的 主意 。 当 企业 懂得 了 数据 对 企业 健康 发 展 的 重要 性 时 ， 就 会 将 DRM 放 到 这 个 位 置 吧 。 


此 外 ， 只 要 有 应 用 程序 DBA， 他 们 就 不 应 该 只 向 应 用 程序 经 理 报告 。 选 择 向 DRM 组 报告 可 以 确保 DBA 技 能 在 整个 企业 内 共 
享 及 交流 。 图 1-8 描 述 了 这 种 推荐 的 报告 结构 。 
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图 1-8 推荐 的 DBA 报 告 结构 


1.10 ” 跨 平 台 的 DBA 问 题 


管理 跨 平台 环境 使 数据 库 管 理 的 工作 变 得 复杂 ， 大 批 的 问题 有 待 解 决 。 首 要 任务 就 是 要 定义 每 个 DBA 工 作 的 范围 。 是 单个 
DBA 管 理 上 所 有 这 些 不 同 的 DBMS， 还 是 每 个 DBA 只 关注 基 个 DBMS 呢 ? 


管理 跨 平 台 环 境 使 数据 库 管 理 的 工作 变 得 复杂 。 


这 是 个 特别 束 手 的 问题 。 一 方面 ， 尽 管 平台 和 各 自 的 供应 商 不 同 ，DBMS 的 功能 却 惊 人 地 相似 。DBMS 是 为 了 存 入 、 取 出 和 
保护 数据 ， 程 序 员 、 程 序 和 终端 用 户 都 通过 DBMS 访 问 并 修改 数据 。 尽 管 每 种 DBMS 对 这 些 项 的 部 署 方法 各 不 相同 ， 管 理 的 问题 
(设计 、 创 建 和 优化 等 ) 却 是 相似 的 。 因 此 ，DBA 不 必 考 虑 平台 或 供应 商 ， 而 应 努力 做 到 支持 跨 平台 DBMS 和 数据库。 


另 一 方面 ， 每 种 DBM S 提 供 了 不 同 的 产品 特点 、 功 能 和 技术 。 要 将 所 有 这 些 差异 及 细微 差别 弄 清 楚 是 件 了 不 起 的 事情 。 设 置 
个 平台 专家 DBA 怎 么 样 ? 这 样 ，Oracle DBA 就 可 以 只 关注 Oracle， 而 DB2 DBA 只 关注 DB2， 以 此 类 推 。 


每 个 企业 都 必须 基于 这 些 考虑 来 做 决定 : DBMS 的 特有 组 合 、 功 能 和 DBA 的 才能 。 如 果 你 的 企业 主要 使 用 一 种 DBMS， 很 少 
使 用 其 他 ， 那 么 每 名 DBA 都 负责 维护 所 有 这 些 DBMS 或 许 更 有 意义 ， 而 不 必 考 虑 平台 或 供应 商 。 对 DBM 分 散 使 用 通常 意味 着 更 
少 的 问题 以 及 对 其 复杂 功能 的 使 用 减少 。 通 过 向 DBA 分 配 跨 DBMS 及 跨 平台 的 任务 ， 可 以 确保 这 些 DBA 能 够 各 尽 其 用 。 如 果 你 
的 企业 用 到 多 种 不 同 的 DBMS， 或 许 明智 的 做 法 是 为 经 常 使 用 的 平台 设立 专门 的 DBA， 而 对 于 不 常 使 用 的 平台 则 由 其 他 DBA 分 


Parad 
Bo 


DBA 职 责 一 旦 分 配 ， 务 必 详 细 记 录 分 管 每 种 DBMSs 的 DBA 的 技能 和 知识 水 平 。 注 意 建 立 一 种 有 效 且 公平 的 轮班 顺序 ， 做 到 
不 对 任何 DBA 或 DBA 组 增加 过 度 的 负担 。 此 外 ， 在 所 有 支持 DBMS 的 环境 中 使 用 组 织 结构 ， 以 促进 数据 库 标 准 和 规程 的 共享 。 


还 需要 注意 的 是 ， 在 支持 多 个 DBMS 和 平台 的 情况 下 ， 应 当 考 虑 部 署 DBA 工 具 、 性 能 监控 仪 以 及 应 对 多 个 平台 的 脚本 。 基 于 
这 个 原因 ， 第 三 方 供 应 商 提 供 的 DBA 工 具 通 常 比 DBMS 供 应 商 提供 的 类 似 工具 更 适用 于 异性 环境 。 


如 果 你 的 企业 支持 多 个 DBMS，DBA 组 应 制订 指南 说 明 在 哪 种 情况 下 可 以 使 用 哪个 DBMS。 且 这 些 指南 不 应 是 固定 的 ， 而 应 
该 为 每 个 DBMS 所 支持 的 应 用 程序 和 数据 库 的 最 佳 类 型 提供 指导 。 将 应 用 程序 强行 应 用 到 给 定 的 DBMS 环 境 并 不 是 一 个 好 办 法 ， 


可 以 通过 这 些 指南 保证 DBMS 应 用 了 最 合适 的 应 用 程序 。 制 订 这 些 指南 应 该 考虑 : 
- 每 种 DBMS 的 特点 ; 
> 操作 系统 的 特点 和 特征 ; 
DBMS 和 操作 系统 组 合 的 联网 能 力 ; 
. 应 用 程序 开发 人 员 的 DBMS 技 能 ; 
.编程 语言 的 支持 ; 


» 任何 其 他 的 组 织 问题 和 需求 。 


1.11 生产 环境 与 测试 环境 


合格 的 数据 库 部 署 至 少 要 创建 并 支持 两 种 独立 的 环境 : 生产 环境 和 测试 环境 (或 开发 环境 ) 。 在 测试 环境 进行 新 的 开发 和 维 
护 工作 ， 而 在 生产 环境 运行 真正 的 业务 运作 应 用 程序 。 将 测试 环境 与 生产 环境 完全 分 开 很 有 必要 ， 这 样 可 以 确保 业务 操作 的 完整 
性 和 性 能 。 如 果 这 两 者 没有 分 开 ， 将 会 导致 开发 工作 对 企业 的 日 常 业务 产生 影响 。 最 终 你 可 能 要 因为 开发 初期 的 错误 程序 代码 而 
访问 或 修改 生产 数据 。 测 试 却 访问 了 生产 数据 会 导致 生产 性 能 问题 。 当 然 了 ， 修 改 了 生产 数据 的 测试 程序 会 创建 无 效 数据 。 


将 测试 与 生产 环境 分 开 以 确保 业务 操作 的 完整 性 和 性 能 。 


测试 环境 不 需要 和 生产 环境 完全 相同 。 生 产 环境 应 包含 所 有 支持 业务 应 用 程序 需要 的 数据 。 而 测试 环境 可 以 只 包含 便于 应 用 
程序 测试 所 需 数据 的 一 个 子 集 。 此 外 ， 测 试 的 DBMS 部 署 通 常 不 会 设置 与 生产 环境 相同 数量 的 资源 。 比 如 ,分配 较 小 的 内 存 用 于 
缓冲 与 缓存 ， 数 据 集 分 配 将 会 更 小 且 用 到 的 设备 也 更 少 ， 并 且 用 于 测试 的 DBMS 软 件 版 本 也 会 比 用 于 生产 的 滞后 (为 了 在 DBMS 
用 于 生产 环境 前 排除 其 本 身 的 错误 ) 。 


尽管 如 此 ， 测 试 环境 与 生产 环境 应 同等 对 待 。 在 生产 环境 中 可 以 访问 的 系统 软件 在 测试 环境 中 同样 也 可 以 访问 ， 因 为 开发 人 
员 需 要 在 同类 型 的 环境 中 创建 应 用 程序 ， 并 最 终 在 该 环境 中 运行 。 


测试 环境 的 另外 一 个 区 别 是 数据 库 的 数量 。 可 能 需要 创建 多 个 数据 库 复 件 用 以 支持 多 个 程序 员 的 并 发 开发 工作 。DBA 必 须 
要 计划 并 创建 这 种 环境 从 而 允许 编程 人 员 控 制 各 自 测试 数据 库 的 内 容 。 开 发 过 程 中 修改 数据 的 程序 可 能 需要 多 次 运行 ， 而 程序 员 
必须 要 能 确保 每 轮 测试 开始 时 所 用 的 数据 是 相同 的 。 不 这 么 做 会 导致 测试 结果 无 效 。 因 此 ，DBA 要 协助 编程 人 员 完 成 创建 数据 
库 负载 和 印 载 工作 ， 为 测试 运行 建立 测试 数据 库 。 测 试 运行 前 ， 数 据 库 要 加 载 测试 数据 ， 运 行 完成 后 ， 程 序 员 可 以 检查 程序 输出 
和 数据 库 内 容 从 而 确认 程序 逻辑 是 否 正 确 。 如 果 不 正 确 ， 将 重复 此 过 程 ， 在 数据 库 中 加 载 以 重 置 数据 并 重新 测试 。 可 以 适当 使 用 
自动 化 卸载 那些 程序 影响 的 数据 库 并 将 结果 与 加 载 文件 比较 。 


试图 预测 测试 应 用 程序 一 旦 用 于 生产 将 会 如 何 执行 是 一 项 困难 的 事情 ， 但 DBA 也 可 以 协助 于 此 。 关 系 DBMS 通 常会 提供 一 个 
收集 数据 库 内 容 的 统计 信息 的 方法 。 然 后 这 些 统计 数字 会 用 于 关系 优化 程序 以 确定 SQL 是 如 何 获 取 数 据 的 。 本 主题 在 第 12 章 会 
更 深入 的 介绍 。 但 要 记 住 ， 测 试 数据 库 比 生产 数据 库 中 的 数据 要 少 得 多 。 但 是 ， 在 某 些 情况 下 ，DBA 可 以 建立 脚本 读 取 生产 统 
计数 字 并 将 它们 复制 到 测试 环境 ， 从 而 使 开发 人 员 能 更 准确 地 衡量 测试 应 用 程序 将 如 何在 生产 环境 执行 。 


一 些 企业 不 止 部 署 两 种 环境 ， 如 图 1-9 所 示 。 如 果 某 些 复杂 的 应 用 程序 开发 项 目 需要 特别 的 关注 ， 可 能 还 会 有 额外 的 隔离 测 
试 。 例 如 ， 单 元 测试 环境 可 能 会 存在 于 个 别 的 程序 开发 ， 然 后 又 通过 集成 测试 环境 确保 新 程序 能 一 起 工作 ， 或 者 新 程序 与 现 有 程 


序 能 正常 工作 。 在 新 的 或 修改 过 的 程序 移植 到 生产 环境 前 ， 可 能 需要 建立 一 个 质量 保证 (QA) 环境 对 它们 执行 严格 的 测试 。 


* 应 用 程序 杜 选 
e 相关 系统 测试 
" 容量 测试 


* 系统 设计 
"数据库 设计 
* 应 用 程序 开发 


* 单元 测试 
+ 集成 测试 
测试 质量 保证 


图 1-9 建立 多 个 数据 库 环 境 


在 新 的 和 修改 过 的 程序 移植 前 ， 可 能 要 有 一 个 质量 保证 环境 对 它们 执行 严格 的 测试 。 


1.12 ”新 技术 对 DBA 的 影响 


每 当 企业 引进 做 生意 的 新 方法 和 新 技术 时 ，DBA 都 要 行动 起 来 。 数 据 是 任何 应 用 程序 的 心脏 ， 随 着 大 多 数 的 新 技术 为 程序 
开发 人 员 所 采用 ， 它 们 也 对 数据 产生 了 影响 。 实 际 上 ， 数 据 是 现代 商业 的 生命 线 ， 数 据 库 容纳 数据 ， 而 DBA 是 数据 库 技术 尤其 
数据 库 集 成 技术 方面 的 专家 。 


接 下 来 研究 三 种 具体 的 新 技术 ， 它 们 在 某 种 程度 上 都 依赖 数据 库 管 理 的 有 效 部 署 : 数据 库 耦 合 的 应 用 程序 逻辑 、 互 联网 电子 
商务 开发 和 手持 计算 。 


1.12.1 ”过 程 DBA: 管理 数据 库 逻 辑 


传统 的 数据 库 管 理 系统 作用 的 域 中 规 中 矩 ， 包 括 存 储 、 管 理 和 访问 数据 。 尽 管 这 些 核 心 功能 依然 适用 于 现代 DBM m, — 
些 额外 的 程序 功能 正 慢 慢 成 为 很 好 的 必需 功能 。 如 触发 器 、 用 户 定义 的 函数 和 人 存储 过 程 ， 都 能 够 为 DBM 而 非 单独 的 应 用 程序 定 
义 业务 规则 。 这 些 功 能 使 得 应 用 程序 逻辑 与 数据 库 服务 器 紧密 耦合 . 


由 于 所 有 最 流行 的 RDBMSs 产 品 都 提供 了 复杂 的 功能 来 促进 数据 库 耦 合 程序 逻辑 ， 所 以 就 需要 额外 的 工作 来 管理 并 使 用 这 些 
功能 。 这 需要 对 数据 库 管理 的 管理 准则 进行 扩展 。 通 常情 况 下 ， 当 有 新 功能 添加 时 ， 管 理 、 设 计 以 及 对 这 些 新 功能 的 管理 统统 都 
是 DBA 的 任务 。 如 果 没 有 适当 的 规划 和 准备 ， 可 能 就 会 导致 混乱 。 首 先 研 究 DBMS 中 数据 库 逻 辑 是 如 何人 存储 的 。 


存储 过 程 


可 以 认为 存储 过 程 是 在 数据 库 中 的 程序 。 存 储 过 程 的 程序 逻辑 是 通过 一 些 数 据 库 命令 进行 维护 、 管 理 和 执行 的 。 使 用 存储 过 


程 主要 是 为 了 将 应 用 程序 代码 从 客户 端 转移 到 数据 库 服务 器 。 存 储 过 程 通常 在 客户 端 / 服 务 器 环境 中 消耗 较 少 ， 因 为 一 个 客户 端 
调用 存储 过 程 就 会 运行 多 个 SQL 语句 。 而 直接 运行 多 个 SQL 语句 的 蔡 代 方案 的 效率 相对 较 低 ， 因 为 其 增加 了 网 络 流量 却 降低 了 应 
用 程序 的 性 能 。 人 存储 过 程 是 独立 的 数据 库 对 象 ， 它 本 质 上 不 与 数据 库 中 的 其 他 任何 对 象 相 关 。 一 个 存储 过 程 可 以 访问 和 /或 修改 
多 个 表 的 数据 。 


触发 器 


触发 器 是 一 种 关联 到 数据 库 表 的 事件 驱动 的 特殊 程序 。 数 据 库 的 数据 改变 时 ， 触 发 器 代码 会 自动 在 RDBMS 中 运行 。 每 个 触 
发 器 都 天 联 到 一 张 单个 的 、 指 定 的 表 。 触 发 器 可 以 看 作 一 种 高 级 形式 的 规则 或 使 用 程序 逻辑 编写 的 约束 。 触 发 器 不 能 直接 调用 或 
执行 ， 一 旦 对 它 所 关联 的 表 进 行 插入 、 更 新 或 删除 操作 ， 它 将 在 RDBMS 中 自动 运行 。 触 发 器 一 是 创建 ， 就 始终 在 它 的 “ 导 火 
索 ” 事 件 出 现时 运行 了 。 


用 户 自 定 义 函 数 


用 户 自 定义 函数 (UDF) 提供 了 一 个 基于 一 系列 输入 值 的 结果 。UDF 是 一 种 可 以 代 蔡 标准 的 、 内 置 SQL 标量 或 列 函 数 执行 的 
程序 。 标 量 函数 将 结果 集 的 每 一 行 数据 进行 变换 ; 列 函数 计算 结果 集中 每 一 行 的 特定 列 的 值 ， 并 返回 一 个 单个 的 值 。 一 旦 写 入 且 
在 RDBMs 中 定义 ，UDF 就 变 得 像 任何 其 他 内 置 的 数据 库 函数 一 样 。 


表 1-2 概 述 了 存储 过 程 、 触 发 器 和 用 户 自 定 义 函 数 之 间 的 差异 。 


表 1-2 程序 数据 库 对 象 


Xf RAB 如 何 执行 
存储 过 程 通过 请 求 显 式 
触发 天 SEN 
HP Á EX PR 对 SQL 功能 进行 扩展 的 程序 逻辑 通过 SQL 请 求 显 式 


管理 存储 过 程 、 触 发 器 和 UDF 


人 存储 过 程 、 触 发 器 和 UDF 一 旦 为 应 用 程序 和 开发 人 员 所 用 ， 就 要 采取 措施 确保 它们 得 到 恰当 的 管理 。DBA 必 须要 解决 质量 
问题 、 可 维护 性 问题 、 效 率 问题 和 可 用 性 问题 。 如 何以 及 何 时 测试 这 些 程序 对 象 ? 测试 一 旦 失败 将 影响 整个 企业 ， 而 不 是 单一 的 
应 用 程序 。 这 无 形 中 增加 了 这 些 对 象 的 可 见 性 和 关键 性 。 一 旦 失败 谁 将 为 之 负责 ”答案 无 疑 就 是 : DBA, 


管理 程序 数据 库 逻 辑 的 重担 应 落 在 熟知 该 准则 的 人 身上 。 此 时 ， 需 要 一 种 新 型 的 DBA 来 管理 数据 库 程 序 逻 辑 。 这 种 新 的 角 
色 可 以 称 作 过 程 DBA。 


过 程 DBA 应 为 那些 需要 程序 逻辑 支持 的 数据 库 管理 任务 负责 。 他 们 的 主要 职责 就 是 确保 存储 过 程 、 触 发 器 和 用 户 自 定义 函 
数 能 有 效 地 规划 、 部 署 、 共 享 和 重用 。 他 们 也 负责 对 所 有 触发 器 、 人 存储 过 程 和 用 户 自 定 义 函 数 进行 编码 与 测试 ， 当 然 ， 编 码 主要 
是 由 应 用 程序 开发 人 员 负 责 的 ， 而 过 程 DBA 负 责 其 准确 度 和 性 能 。 


过 程 DBA 应 参与 并 主导 对 所 有 程序 数据 库 对 象 (触发 器 、 存 储 过 程 科 UDF) 的 审查 和 管理 。 尽 管 过 程 DBA 不 可 能 像 应 用 程 
序 开 发 人 员 或 系统 分 析 师 那样 精通 编程 ， 他 们 也 要 能 适当 地 编写 并 审查 程序 代码 。 要 求 的 技能 水 平 依赖 DBMS 使 用 何 种 语言 创建 
程序 对 象 ， 该 语言 在 企业 内 部 接受 的 程度 如 何 ， 以 及 是 否 存在 内 部 组 织 专门 创建 通用 且 可 重用 的 程序 。 表 1-3 给 出 了 一 个 过 程 
DBA 参 与 每 种 程序 对 象 的 合理 比重 。 此 外 ， 过 程 DBA 要 能 在 生产 环境 的 数据 库 程 序 对 象 出 现 问题 时 随 传 随 到 。 


表 1-3 ”过 程 DBA 对 每 种 对 象 的 参与 度 


对 象 类 型 过 程 DBA 参与 度 
存储 过 程 fs 太 可 能 实际 编写 存储 过 程 ， 在 所 有 代码 转移 到 生产 环境 前 对 它们 进行 审查 ,传达 可 用 
iz 性 并 提升 重用 性 
触发 器 实际 编写 、 测 试 、 调 试 触 发 需 ， 传 达 和 触发 器 的 部 署 以 使 应 用 程序 知晓 
不 太 可 能 实际 编写 UDF， 与 开发 团队 紧密 合作 确保 UDF 功能 性 和 性 能 ， 在 所 有 代码 转 


E 并 提升 重用 度 


用 户 自 定义 函数 eee yn ere i 
IP Ae 移 到 生产 环境 前 对 它们 进行 审查 ,传达 可 用 习 


过 程 DBA 应 参与 并 主导 对 所 有 程序 数据 库 对 象 ( 触 发 器 、 存 储 过 程 和 UDF) 的 审查 和 管理 。 


对 于 过 程 DBA 来 说 ， 沟 通 技 巧 与 技术 敏锐 性 同样 重要 ( 详 见 图 1-10) 。 除 了 管理 并 优化 数据 库 程序 对 象 ， 过 程 DBA 还 必须 
告知 开发 人 员 存 在 新 的 触发 器 、 存 储 过 程 和 UDF， 此 外 ， 他 们 还 要 提升 这 些 对 象 的 重用 性 。 如 果 这 些 对 象 不 为 程序 员 所 知 ， 它 
们 将 永远 不 被 使 用 。 过 程 DBA 也 可 能 会 有 其 他 的 程序 管理 职责 ， 根 据 DBA 的 数量 以 及 正在 开发 的 应 用 程序 的 数量 ， 他 们 可 能 被 


分 配额 外 的 工作 ， 比 如 : 
. 参与 应 用 程序 代码 设计 审查 ; 


- 审查 并 分 析 SQL 访 问 路 径 (根据 EXPLAIN 或 SHOWPLAN) ; 


* 编写 并 分 析 复杂 的 SQL 语句 ; 
. 重 写 最 佳 查询 。 


将 编码 相关 的 工作 交 由 过 程 DBA 分 担 有 助 于 其 他 DBA 专 注 于 实际 的 物理 数据 库 设 计 和 部 署 ， 从 而 才 会 有 更 好 的 数据 库 。 但 
过 程 DBA 要 与 传统 DBA 向 同一 个 管理 单元 报告 ， 如 此 可 以 更 好 地 在 过 程 DBA 和 传统 的 关注 数据 的 DBA 之 间 共 享 技能 ， 当 然 ， 这 
需要 两 者 之 间 更 多 的 协作 。 过 程 DBA 的 一 种 典型 职业 路 径 就 是 他 们 本 身 来 自 开 发 团队 ， 因 为 那里 才 是 编码 技能 的 根基 。 


we [LS 
存储 过 程 


性 能 监控 


触发 器 -一 > s 
管理 过 程 
人 | RDBMS 
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We ee DA 变更 管理 ` e 
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图 1-10 ”过程 DBA 的 职责 


1.12.2 互联网: 从 DBA 到 eDBA 


尽管 现在 互联 网 已 不 能 看 作 一 种 趋势 ， 企 业 和 技术 人 员 仍 需 调 整 他 们 的 进程 来 适应 电子 商务 的 发 展 。 各 种 类 型 和 规模 的 企业 
都 在 使 用 互联 网 技术 来 加 快 业务 进程 ， 并 且 数 据 库 管理 的 实践 和 流程 也 因 互 联网 应 用 程序 和 数据 库 的 采用 而 受到 影响 。 


电子 商务 必须 能 够 适应 不 断 变化 并 为 之 作出 反应 。 在 线 的 生意 永 不 打 料 。 人 们 期 望 访问 的 网 站 一 直 可 用 ， 无 论 什么 时 间 在 什 
么 地 方 。 纽 约 可 能 是 凌晨 两 点 ， 但 在 世界 的 某 些 地 方 却 是 黄金 时 间 。 电 子 商 务 需要 一 直 曹 业 且 一 天 24 小 时 一 年 365 天 (E366 
A) 和 顾客 打交道 ， 否 则 就 会 造成 损失 。 一 个 网 站 出 了 问题 ， 顾 客 就 会 转战 它 处 ， 因 为 所 谓 竞 争 就 是 简单 地 点 一 下 鼠标 。 所 以 ， 
管理 电子 商务 的 人 一 定 要 是 内 行 、 前 瞻 且 时 刻 保持 警惕 。 


接受 电子 商务 的 疯狂 节奏 需要 经 营 者 为 之 作出 改变 ，DBA 就 极 受 电子 商务 的 影响 。 将 网 络 与 传统 的 上 T 服 务 (如 DBMS) 相 结 
合 ， 对 数据 库 管 理 员 提 出 了 更 高 的 期 望 。 


DBA 能 够 管理 基于 网 络 的 应 用 程序 ， 且 因 懂 得 互联 网 引发 的 特殊 间 题 而 称 作 eDBA。eDBA 同 样 需 要 传统 DBA 具 备 的 所 有 知 
识 和 进行 的 所 有 培训 。 但 需要 将 这 些 技能 进行 调整 以 适应 互联 网 驱动 下 的 应 用 程序 和 数据 库 。 网 络 加 上 传统 的 应 用 程序 和 数据 
E, 产生 了 一 种 复杂 的 基础 设施 ( 详 见 图 1-11) 。eDBA 要 能 驾驭 这 种 复杂 且 异 形 的 基础 设施 ， 并 能 够 在 数据 库 受 到 此 基础 设施 
影响 时 提供 专业 的 建议 。 


CRM 应 用 程序 


网 络 服务 器 


Linux 与 UNIX 
数据 库 服务 器 


UNIX 服 务 器 


Windows 服 务 器 
负载 平衡 器 
防火 墙 


大 型 主机 


ERP 应 用 程序 


中 端 服务 器 
图 1-11 网 络 数据 库 能 力 导 致 的 复杂 基础 设施 

DBA 能 够 管理 基于 网 络 的 应 用 程序 ， 且 因 懂 得 互联 网 引发 的 特殊 问题 而 称 作 eDBA。 
实际 上 ， 当 互联 网 与 数据 库 技术 结合 时 ， 会 有 多 种 因素 影响 数据 库 的 管理 ， 一 些 问题 包括 

< 24/7 全 天 候 数据 可 用 性 。 

- 新 技术 的 采用 ， 如 Java 和 XML。 

- 连接 到 网 络 。 

“ 遗留 数据 与 现代 基于 网 络 的 应 用 程序 的 集成 。 

"数据库 与 应 用 程序 架构 。 

- 基于 网 络 的 管理 。 

- 互联 网 的 性 能 工程 学 。 


© 不 可 预知 的 工作 荷载 。 


1.12.3 个 人 DBA 与 云 计算 


个 人 设备 ， 通 常 不 仅 指 手机 还 包括 掌上 电脑 ， 正 在 快速 成 为 现代 化 管理 者 与 商人 的 必需 品 。 手 机 是 一 种 手持 式 计算 设备 ， 有 
时 也 会 有 数据 库 管理 系统 。 它 为 什么 这 么 吸引 眼球 呢 ? 它 是 否 改 变 了 你 使 用 手机 的 方式 呢 ?” 它 又 对 iT 部 门 意味 着 什么 呢 ? 


流行 的 移动 计算 平台 包括 : Symbian 操作 系统 、Windows Mobile、iPhone 操 作 系 统 和 Android。 

手机 提供 了 许多 便利 。 它 体积 小 巧 便于 携带 ， 不 会 干扰 移动 工作 者 的 工作 ， 而 且 目 前 几乎 每 个 人 都 随身 携带 手机 ， 提 升 它 的 
计算 能 力 是 势 在 必 行 的 。 

或 许 这 些 设备 最 大 的 好 处 是 它们 可 以 运行 移动 应 用 程序 。 不 管 何 时 何 地 ， 企 业 移动 应 用 程序 将 从 主机 服务 器 获取 的 信息 转发 
给 遍布 的 移动 设备 ， 这 种 情况 并 不 少见 。 移 动 应 用 程序 使 用 云 作 为 后 端 越 来 越 流行 。 

企业 移动 应 用 程序 依赖 从 主机 服务 器 获取 的 信息 。 

什么 是 云 计 算 

云 计 算 为 用 户 IT 资源 交付 提供 了 一 种 新 的 模式 。 云 计算 的 主要 定义 特点 造成 了 对 无 限 的 计算 资源 按 需 访问 的 错觉 。 一 个 很 好 
的 云 计 算 服 务 的 例子 来 自 Salesforce.com， 它 提供 了 通过 网 络 对 CRM 应 用 程序 的 访问 。 

云 计 算 服 务 的 另 一 个 普遍 的 现象 是 用 户 可 以 租用 计算 能 力 且 不 必 承 诺 。 你 可 以 租用 一 台 服 务 器 而 不 需要 购买 ， 然 后 支付 用 到 
的 计算 能 力 的 费用 。 这 曾经 称 作 效用 计算 ， 它 模仿 了 人 们 如 何 支付 公共 设施 ， 如 水 或 电 。 因 此 这 是 一 种 “ 随 需 随 用 ”的 服务 。 

从 数据 库 的 角度 来 看 ， 有 一 些 云 服务 ， 包 括 Amazon 的 SimpleDB，Google APP Engine 数 据 存储 。 此 外 ，Microsoft SQL Azure 也 
支持 云 数据 。 

云 计 算 可 以 让 即使 是 最 小 的 企业 其 至 个 人 获得 计算 资源 ， 这 在 以 前 是 不 可 能 的 。 

移动 应 用 程序 的 设计 与 部 署 不 像 桌面 个 人 计算 机 应 用 程序 开发 那样 简单 。 对 于 移动 应 用 程序 的 开发 人 员 来 说 ， 考 虑 该 应 用 程 
序 将 用 于 什么 环境 是 很 重要 的 。 


虽然 带 来 的 好 处 是 显著 的 ， 但 企业 将 个 人 设备 融入 基础 设施 也 会 面临 挑战 。 设 备 上 的 数据 必须 得 到 专业 的 管理 以 确保 其 完整 
性 和 可 靠 性 。 由 于 该 设备 是 远程 的 ， 数 据 共享 可 能 比较 困难 。 手 机 上 的 业务 数据 必须 通过 可 靠 的 方式 与 现 有 的 企业 系统 和 数据 库 
保持 同步 。 从 业务 和 合 规 性 的 角度 来 看 ， 很 难 评估 移动 应 用 程序 带 来 的 风险 。 移 动 设备 很 容易 保存 不 当 且 没有 适当 的 安全 措施 可 
能 会 导致 数据 泄漏 。 


所 有 的 DBMS 供 应 商都 提供 了 各 自 旗舰 产品 的 轻 量 级 版 本 在 个 人 设备 上 运行 。 例 如 ，1BM 投 放 市 场 的 DB2 个 人 版 、Oracle 销 
售 的 移动 数据 库 、Microsoft 提 供 的 SQL Server 精 简 版 ， 以 及 Sybase 提供 的 Adaptive Server Anywhere 数 据 库 。 总 体 思路 是 将 
移动 设备 中 的 少量 关键 数据 存储 在 数据 库 中 。 接 下 来 ， 使 本 地 数据 库 与 企业 数据 库 服务 器 上 的 长 期 数据 同步 。 每 种 移动 DBM s 都 
提供 了 移动 设备 与 企业 服务 器 平台 之 间 来 回 同步 数据 的 技术 。 


对 DBA 的 影响 


DBA 不 需要 对 每 个 PDA 的 数据 库 进行 管理 ， 但 DBA 的 工作 会 受到 数据 库 开 发 的 影响 。 不 需要 对 那些 存储 在 PDA 上 的 数据 库 
的 大 小 进行 深入 调整 和 管理 ， 企 业 数 据 库 部 署 时 才 要 求 。 然 而 ， 会 要 求 DBA 帮 助 设计 适用 于 小 型 设备 如 PDA 的 数据 库 。 当 然 ， 


这 不 是 最 大 的 影响 。 


对 DBA 的 一 个 很 大 的 影响 来 自 规划 如 何 管理 数 以 百 计 或 数 以 干 计 的 PDA 的 数据 同步 。 什 么 时 候 开始 同步 ? 将 对 使 用 大 型 生 
产 数据 库 的 应 用 程序 造成 什么 影响 ? 如 何 确保 移动 用 户 的 数据 可 靠 且 按时 同步 ? 


此 外 ， 对 于 云 计算 的 部 署 ，DBA 可 能 要 负责 保证 可 靠 数 据 的 可 用 性 。 设 计 并 调整 云 计算 的 数据 库 部 署 可 以 将 重要 的 资源 用 


于 管理 大 量 的 数据 并 保证 其 全 天 候 的 可 用 性 。 


这 些 都 不 是 小 问题 。 开 始 部 署 大 批 的 移动 数据 库 前 ， 用 户 必须 同步 他 们 的 数据 以 确保 DBA 人 员 已 经 为 可 能 产生 的 影响 做 好 
了 准备 。 与 大 多 数 其 他 的 事情 一 样 ， 准 备 不 足 也 许 会 面临 灾难 ， 但 是 必须 要 准备 。 通 过 了 解数 据 同 步 技 术 、 云 计算 和 企业 内 部 远 
程 数 据 库 用户 的 潜在 需要 ，DBA 人 员 必 须 做 好 准备 来 支持 移动 工作 人 员 。 


在 为 手持 设备 支持 数据 库 做 准备 的 过 程 中 ， 还 需要 审查 企业 的 应 用 程序 并 尝试 确定 哪些 可 能 最 先 受到 影响 。 那 些 有 远程 工作 
者 的 公司 ， 如 分 布 式 的 销售 队伍 或 交付 跟踪 服务 将 最 有 可 能 首先 受到 影响 。 花 些 时 间 审 查 这 些 应 用 程序 的 数据 需求 ， 以 及 大 量 涌 
入 的 远程 连接 对 现 有 的 系统 可 能 会 造成 的 影响 。 


普遍 计算 技术 和 移动 工作 者 已 是 事实 ,DBA 人 员 必 须 做 好 准备 以 一 种 有 效 的、 共享 数据 的 基础 设施 来 支持 这 些 移动 工作 
者 。 


1.12.4 NoSQL、 大 数据 和 DBA 


NoSQL 是 可 以 影响 DBA 工 作 的 另 一 种 趋势 。 正 如 其 字面 意思 ，NoSQL 是 一 种 最 基本 的 动作 。 也 就 是 说 NoSQL DBM SS 不支 
持 SQL。 上 升 一 个 层面 来 说 ，NoSQL 意 味 着 非 关 系 型 的 、 分 布 式 的 、 灵 活 的 和 可 扩展 的 。 大 多 数 NoSQL 产 品 还 是 开源 的 。 


NoSQL 产 生 于 对 现代 数据 库 系 统 支 持 网 络 这 一 举措 的 权衡 需 求 。 此 外 ，NoSQL DBMS 的 一 些 常见 属性 包括 : 缺乏 一 种 模 
式 、 使 用 简单 、 支 持 复制 和 “最 终 一 致 性 ”的 能 力 (不 是 典型 的 ACID 交 易 能 原子 性 、 一 致 性 、 独 立 性 和 耐久 性 ) 。 它 并 
不 意味 着 没有 SQL 支持 ， 实 际 上 一 些 NoSQL 产 品 已 经 开始 支持 SQL 了 ， 于 是 一 些 学 者 将 NoSQL 定 义 为 “不 只 是 SQL”。 


NosQL 产 品 的 一 些 例子 


- Cassandra: http://cassandra.apache.org/ 
- CouchDB: http://couchdb.apache.org/ 
- HBase: http://hbase.apache.org/ 
- mongoDB: www.mongodb.org/ 
- Riak: www.basho.com/ 
NoSQL 运 动 是 和 大 数据 运动 联系 在 一 起 的 。NoSQL 数 据 库 是 为 了 提供 低 成 本 的 存储 和 对 大 量 数据 的 访问 。 
部 署 了 NoSQL， 通 常情 况 下 就 只 能 以 一 种 方式 访问 数据 ， 几 乎 没有 即兴 地 、 临 时 查询 的 灵活 性 。 

对 DBA 的 影响 


NoSQL 的 另 一 特点 是 它 儿 乎 不 需要 数据 库 管理 。 当 然 ， 必 须 建 了 DBMS 并 进行 管理 ， 数 据 也 要 备份 。 所 以 当 有 人 告诉 你 任 
何 数据 库 系 统 不 需要 数据 库 管理 时 ， 不 要 相信 和 就 是 了 。 


1.12.5 ”新 技术 对 DBA 的 影响 


企业 引入 新 技术 ， 通 常 DBA 团 队 会 率先 研究 使 用 。 上 述 所 列 技术 仅 作 为 例子 说 明 近 期 的 一 种 发 展 趋势 ， 以 及 管理 并 部 署 高 
效 、 有 效 数 据 库 需 要 的 技术 。 大 多 数 新 技术 都 会 对 DBA 产 生 影响 ， 或 多 或 少 。 


1.13 DBA 认证 


IT 行业 的 专业 认证 逐渐 成 为 一 种 趋势 ， 现 在 很 多 IT 职业 都 有 专业 认证 。DBA 的 有 效 认 证 等 级 正在 以 惊人 的 速度 增长 。 目 前 常 
用 的 DBMS 平 台 都 有 认证 流程 ， 包 括 IBM DB2、Microsoft 的 SQL Server 和 Oracle。DBA 认 证 概念 本 质 上 是 为 了 证 明 他 有 足够 的 
能 力 执行 数据 管理 任务 和 承担 数据 管理 的 责任 。 


认证 的 目的 是 好 的 ， 但 问题 是 ，DBA 通 过 了 考试 并 不 能 作为 他 能 够 胜任 这 一 复杂 工作 的 可 行 指标 ， 有 些 东 西 必须 要 在 实践 
中 才能 学 到 。 我 现在 并 不 是 在 说 认证 是 无 用 的 。 其 实 ， 通 过 参加 考试 ， 你 需要 关注 那些 你 不 懂 的 问题 ， 这 样 可 以 找 出 你 在 哪些 方 
面 不 足 ， 在 哪些 方面 可 以 做 得 更 好 。 难 道真 的 有 人 相信 ， 一 个 人 通过 了 正式 的 DBA 考 试 就 和 一 个 有 多 年 工作 经 验 的 DBA 是 一 样 
的 吗 ? 企业 应 该 根据 能 够 说 明 一 个 人 能 力 水 平 的 工作 经 验 聘请 DBA。 当 然 ， 同 时 具备 经 验 和 认证 的 人 比 只 具备 其 中 之 一 的 人 更 
好 。 


认证 可 以 让 你 就 业 更 容易 。 


我 非常 赞成 专业 的 DBA 人 花 时 间 学 习 并 通过 认证 考试 ， 并 不 是 认证 能 够 使 你 成 为 一 个 更 好 的 DBA， 而 是 认证 可 以 让 你 更 容易 
就 业 。 有 些 公司 只 用 有 认证 的 专家 。 由 于 |IT 越 来 越 复 杂 ， 以 证 书 作为 招聘 的 导向 也 是 一 种 趋势 。 如 果 你 认为 在 你 职业 生涯 的 某 个 
时 候 有 可 能 换 工 作 (有 谁 不 会 呢 ?) ， 有 个 证 书 还 是 非常 值得 的 。 


要 注意 的 是 ，DBA 认 证 考试 中 有 时 会 问 一 些 生 涩 的 语法 问题 ， 这 些 问 题 并 不 能 很 好 地 衡量 一 个 DBA 的 技能 。100% 的 语法 准 
确 率 是 那些 手册 与 DBA 工 具 必 须 做 到 的 。 那 些 语法 会 经 常 改变 ， 完 全 没有 必要 记 住 它 们 。 更 有 必要 的 是 ， 需 要 时 你 要 能 知道 去 
哪里 查找 这 些 语 法 、 参 数 和 你 问题 的 答案 ， 这 样 就 行 了 。 比 如 ， 你 需要 的 那些 信息 就 包含 在 手册 和 参考 书 中 。 对 于 DBMS 概 念 和 
IT 基础 ，DBA 应 该 具备 应 有 的 广度 ， 对 于 企业 数据 库 系统 的 工作 方式 ，DBA 则 应 该 具备 应 有 的 深度 。 记 住 SQL 语 法 和 结构 的 每 一 
个 细节 是 在 浪费 时 间 ， 因 为 它 是 复杂 的 、 时 刻 都 在 变化 。 换 名 话说， 知道 当前 什么 能 做 (或 不 能 做 ) 比 知道 如 何 做 的 确切 语法 更 
好 。 


DBA 认 证 考试 中 有 时 会 问 一 些 生 涩 的 语法 问题 ， 这 并 不 能 很 好 地 衡量 一 个 DBA 的 技能 。 


如 果 你 决定 要 考 认 证 ， 就 需要 人 花 些 时 间 为 考试 做 准备 。 有 一 些 现成 的 书 和 自学 软件 非常 有 用 。 这 些 书 籍 和 课程 涵盖 考试 中 最 
有 可 能 出 现 的 题目 ， 并 提供 了 样题 来 帮 你 做 准备 。 在 许多 方面 ， 这 都 像 在 准备 大 学 入 学 考试 ， 如 SAT 考 试 。 


并 且 一 旦 你 拿 到 证 书 ， 一 定 要 在 你 的 简历 和 名 片 中 (如果 公司 允许 ) “ 秀 ” 出 来 。 
有 关 最 流行 的 DBMS 产 品 的 专业 认证 的 信息 ， 请 查询 表 1-4 给 出 的 网 站 。 


表 1-4 DBA 认 证 信息 资源 


DBMS 有 关 认 证 信息 的 网 站 
Oracle, MySQL http://education.oracle.com/ 
Microsoft SQL Server www.microsoft.com/learning/en/us/default.aspx 
IBM DB2, Informix www.ibm.com/certify 


Sybase www.sybase.com/detail?id=1009636 


1.14 本 书 的 其 余部 分 


第 1 章 带 你 领略 了 DBA 的 世界 。 理 想 情 况 下 ， 你 已 经 对 这 个 职位 的 复杂 性 和 一 名 优秀 的 DBA 的 必 备 素质 充满 尝 敬 。 本 书 的 其 
余部 分 将 详细 探讨 DBA 的 任务 、 角 色 和 责任 。 继 续 阅 读 ， 了 解 DBA 面 临 的 各 种 挑战 以 及 如 何 克 服 它们 。 


1.15 [EIER 


1. 从 较 高 的 水 平 讨论 了 DBA 的 主要 工作 职责 。 

2. 企 业 使 用 关系 数据 库 所 面临 的 一 个 最 大 的 问题 是 什么 ? 

3. 数 据 管理 员 和 数据 库 管 理 员 之 间 的 区 别 是 什么 ? 

4. 哪 些 因 素 决 定 了 所 需 的 DBA 数 量 来 很 好 地 支持 企业 的 数据 库 环 境 ? 
5. 新 科技 如 何 影响 DBA 的 工作 ? 

6. 论 证 引入 程序 DBA 后 产生 的 技术 影响 。 

7 数据 库 架 构 师 和 系统 管理 员 之 间 的 区 别 是 什么 ? 

8. 最 有 可 能 负责 安装 DBMS 新 版 本 的 职务 是 什么 ? 

9.DBA 必 须 了 解 的 三 种 类 型 的 完整 性 是 什么 ? 


10. 一 名 获得 认证 的 DBA 一 定 是 合格 的 DBA 吗 ”为 什么 是 或 为 什么 不 是 ? 


附加 问题 


DBA 为 什么 必须 要 准备 成 为 一 个 多 面 手 ? 


第 2 章 ”创建 数据 库 环 境 


与 DBA 的 工作 相关 的 主要 任务 之 一 是 选择 并 安装 DBMS。 遗 憾 的 是 ， 许 多 企业 的 管理 人 员 和 IT 专家 缺乏 数据 库 管理 的 背景 知 
识 ， 他 们 以 为 只 要 安装 了 DBMS 工 作 就 结束 了 。 事 实 是， 选择 并 安装 DBMS 不 是 DBA 的 工作 中 最 困难 的 。 建 立 一 个 可 用 的 数据 库 
环境 需要 很 多 技巧 、 知 识 和 考虑 因素 。 本 章 将 概述 建立 可 用 的 数据 库 环 境 需 要 遵循 的 一 些 原则 。 


2.1 定义 企业 的 DBMS 策 略 
为 企业 数据 库 管理 选择 适合 的 DBMS 不 像 过 去 那样 困难 了 。 由 于 行业 整合 以 及 几 大 巨头 的 控制 ， 主 要 DBMS 供 应 商 的 数量 随 


为 企业 数据 库 管理 选择 适合 的 DBMS 不 像 过 去 那样 困难 了 。 


然而 ， 大 中 型 企业 通常 会 运行 多 种 DBMS 产 品 ， 从 2~10 种 不 和 等。 例如， 一 家 大 型 公司 在 大 型 机 上 使 用 IMS 或 IDMS 和 DB2,， 
而 在 几 台 不 同 的 UNIX 服 务 器 上 使 用 Oracle 和 MySQL， 在 Windows 服 务 器 上 使 用 Microsoft SQL Server。 而 且 还 在 各 种 不 同 的 
平台 安装 其 他 的 DBMS 产 品 ， 如 Sybase、Ingres、Adabas 和 PostgreSQL， 以 及 单 用 户 的 PC DBMS 产 品 ， 如 Microsoft 
Access、Paradox 和 FileMaker。 是 谁 安装 了 所 有 这 些 DBMS? 为 什么 安装 ? 


很 不 幸 ， 答 案 通 常 是 在 决策 时 没有 太 多 的 思考 和 规划 。 有 时 候 决 定购 买 和 安装 一 种 新 的 DBM 是 基于 新 业务 或 新 应 用 程序 的 
需要 。 如 果 企 业 没 有 DBMS 而 不 得 不 购买 一 种 ， 这 是 合乎 情理 的 ， 但 这 样 的 情况 很 少 。 无 论 是 否 在 用 DBMS， 通 常 认 为 新 应 用 程 
序 需要 新 的 DBMS。 有 了 时候 购 买 并 安装 了 一 种 新 的 DBMS 产 品 ， 但 事先 并 没有 评估 该 应 用 程序 使 用 已 有 的 DBMS 能 否 部 署 成 功 。 
或 者 ， 更 可 能 的 是 ，DBA 事 先知 道 该 应 用 程序 可 以 使 用 已 有 的 DBMS 部 署 ， 但 苦于 没有 权利 或 反对 购买 新 DBMS 的 建议 得 不 到 支 


持 。 


还 有 其 他 的 原因 使 一 家 企业 存在 多 种 DBMS 平 台 。 或 许 是 公司 购买 的 现成 的 商业 应 用 程序 包 在 已 有 的 任何 DBMS 平 台 都 不 能 
运行 。 有 时 候 决 定购 买 新 的 DBMS 是 本 着 支持 最 新 和 最 先进 技术 的 打算 。 例 如 ， 许 多 大 型 机 商家 都 握 弃 了 分 层 (IMS) 或 
CODASYL (IDMS) 数据 库 模型 ， 进 而 选择 了 关系 模型 (DB2) ， 导 致 需要 学 习 并 支持 额外 的 DBMS。 后 来 ， 随 着 C/S 计 算 的 流 
行 ， 额 外 的 DBMS 也 开始 在 UNIX、Linux 和 Windows 服 务 器 上 部 署 了 。 


一 旦 DBMS 安 装 成 功 ， 印 载 就 比较 困难 了 ， 因 为 不 同 的 DBMS 之 间 不 兼容 以 及 可 能 还 需要 改变 程序 代码 。 此 外 ， 安 装 新 的 
DBMS 时 ， 通 常 不 会 转移 上 日 的 应 用 程序 和 数据 库 。 因 此 需要 保留 旧 的 DBMS 继 续 提供 支持 。 这 使 得 DBA 的 工作 变 得 复杂 。 


那么 ， 该 怎么 做 呢 ? 应 当 赋 予 DBA 团 队 决定 企业 DBMS3 的 权力 ， 并 且 没有 DBA 团 队 的 同意 ， 其 他 任何 企业 部 门 不 得 购买 
DBMS。 然 而 ， 这 样 的 条 款 势 必 难 以 实施 和 执行 。 企 业 政 治 经 常 针 对 DBA 团 队 ， 因 为 相 比 其 他 的 企业 高 管 ，DBA 拥 有 较 少 的 权 
力 。 


应 当 赋 予 DBA 团 队 决 定 企 业 DBMS 的 权力 。 


2.1.1 DBMS 选 型 


DBA 团 队 应 当 就 企业 内 部 支持 的 DBMS 产 品 设置 一 项 政策 ， 只 要 有 可 能 ,该 政策 应 尽量 减少 不 同 DBMS 产 品 的 数量 。 拥 有 多 
种 操作 系统 和 多 类 型 硬件 的 部 门 ， 选 择 默 认 的 DBMS 即 可 。 除 非 有 令 人 信服 的 业务 案例 ， 且 通过 了 DBA 团 队 的 技术 检验 ， 否 则 不 
允许 背离 默认 的 DBMS。 


大 多 数 DBMS 产 品 具有 类 似 的 功能 ， 并 且 如 果 有 些 功能 今天 不 存在 ,在 接 下 来 的 18~24 个 月 也 会 存在 。 因 此， 在 为 某 个 特定 
功能 选择 DBMS 时 务必 小 心 谨慎 。 


从 一 级 供应 商 选 择 DBMS 产 品 。 


DBMS 选 型 时 ， 明 智 的 做 法 是 在 一 级 供应 商 中 选择 ， 如 表 2-1 所 列 。 一 级 代表 最 大 的 供应 商 ， 拥 有 市 面 上 大 量 部 署 和 支持 的 


产品 。 使 用 DB2 或 Oracle 不 会 出 错 ， 因 为 二 者 都 很 受 欢迎 并 且 支 持 几乎 任何 类 型 的 数据 库 。 另 一 种 主要 的 产品 是 Microsoft SQL 
Server， 但 仅 适 用 于 Windows 平 台 。DB2 和 Oracle 可 以 在 多 种 平台 上 运行 ， 从 大 型 机 到 UNIX、Windows 甚 至 手持 设备 。 在 特 
定 情况 下 才 会 选择 这 三 种 之 外 的 DBM S 产 品 。 


表 2-1 一 级 DBMS 供 应 商 


DBMS 供应 商 DBMS 产品 
IBM 公司 
New Orchard Road 

: DB2 
Armonk, NY 10504 
电话 : (914) 499-1900 
(ZÈ) 

DBMS 供应 商 DBMS 产品 
Oracle 公司 
500 Oracle Parkway 

- Oracle 
Redwood Shores, CA94065 
电话 : (650 ) 506-7000 
Microsoft 公司 
One Microsoft Way 
SQL Server 


Redmond, WA 98052 
电话 : (425 ) 882-8080 


三 大 巨头 之 后 有 MySQL、sSybase、Teradata 和 Informix。 表 2-2 列 出 了 这 些 二 级 DBMS 供 应 商 。 所 有 这 些 产品 都 是 合格 的 
DBMSs 产 品 ， 只 是 安装 基数 较 小 ， 且 它们 的 产品 设计 与 销售 都 以 市 场 利 基 为 目的 ， 或 者 相 比 三 大 巨头 (IBM、Oracle 和 
Microsoft) ， 它 们 的 公司 规模 较 小 且 拥 有 较 少 的 资源 ， 所 以 从 二 级 供应 商 选 择 DBMS 有 一 定 的 风险 。 然 而 ， 部 署 二 级 方案 也 可 
能 有 充分 的 理由 ， 比 如 ，Informix 可 以 提供 高 性 能 ， 或 者 Teradata 的 数据 仓库 和 分 析 能 


表 2-2 二 级 DBMS 供 应 商 


DBMS 供应 商 DBMS 产品 
IBM 公司 
New Orchard Road 
Armonk., NY 10504 
电话 : (914 ) 499-1900 
Sybase 公司 (SAP 公司 ) 
6475 Christie Avenue 
Emeryville, CA 94608 
电话 : (510) 922-3500 


Informix Dynamic Server 


Adaptive Server 企业 版 


Teradata 公司 


10000 Innovation Drive 


Teradata 
Dayton, OH 45342 
电话 : (937 ) 242-4030 
MySQL (Oracle 公司 之 附属 公司 ) 
ee MySQL 


电话 : (208 ) 338-8100 


当然 ， 市 场 上 还 有 其 他 DBM S 产 品 ， 其 中 不 乏 优 秀 的 产品 值得 考虑 用 作 专 业 处 理 、 某 种 预定 义 的 需求 以 及 其 他 合适 的 事情 。 
如 果 你 的 企业 斥 巨 资 进入 开源 软件 领域 ，PostgreSQL、EnterpriseDB 或 MySQL 会 是 可 行 的 选择 。 如 果 目 标 DBMS 对 于 一 个 具体 


项 目 非常 重要 ， 你 可 能 会 考虑 ObjectDesign 或 Versant。 同 时 还 有 多 种 NoSQL DBMS 产 品 ， 如 Hadoop、Cassandra 和 


MongoDB。 [1] 
选择 任何 级 别 较 低 的 产品 可 能 招致 意外 风险 。 


然而 ， 对 于 大 多 数 的 数据 管理 需求 ， 任 何 来 自 一 级 或 者 二 级 DBMS 供 应 商 的 DBMS 产 品 都 将 提供 足够 的 功能 上 风险 很 低 。 可 
用 的 DBMS 产 品 很 多 ， 且 每 种 都 有 某 些 功能 值得 具体 分 析 对 待 。 选 择 任 何 级 别 较 低 供应 商 的 产品 (即使 像 Software AG 的 
Adabas 和 Actian 的 Ingres 这 样 响当当 的 名 字 ) 可 能 招致 意外 风险 。DBMS 供 应 商 列 表 请 参阅 附录 B。 


我 不 希望 这 听 起 来 好 像 DBMS 选 型 一 样 不 需要 费 脑筋 ， 为 你 的 具体 情况 选择 适合 的 DBM 还 是 需要 制订 策略 和 计划 的 。 
DBMS 选 型 时 ， 一 定 要 注意 如 下 这 些 因素 : 

对 操作 系统 的 支持 。DBMS 是 否 支持 企业 使 用 的 操作 系统 ， 包 括 目前 使 用 的 和 计划 使 用 的 版 本 ? 

» 企业 的 类 型 。DBMS 选 型 时 要 考虑 企业 的 理念 。 有 些 企业 非常 保守 ， 它 们 喜欢 严格 控制 环境 ， 因 此 这 些 企 业 倾向 于 传统 的 
大 型 机 环境 。 政 府 运作 、 人 金融 机 构 、 保 险 和 保健 公司 往往 倾向 于 保守 派 。 更 多 自由 派 企业 往往 愿意 考虑 其 他 架构 ， 这 种 情况 在 一 


些 不 那么 保守 的 企业 并 不 少见 ， 如 制造 企业 、 网 络 公 司 和 大 学 。 最 后 ， 有 些 公司 根本 不 信任 将 Windows 作 为 关键 任务 的 环境 ， 它 
们 更 愿意 使 用 UNIX。 这 就 排除 了 一 些 数据 库 供应 商 (尤其 是 Microsoft SQL Server) o 


基准 。 什 么 性 能 基准 对 于 DBMS 供 应 商 和 DBMS 的 其 他 用 户 是 可 用 的 ? 事务 处 理性 能 委员 会 (TPC) 公布 的 官方 数据 库 性 


能 基准 ， 可 用 作 许 多 不 同类 型 的 数据 库 处 理性 能 整体 上 的 基本 指导 方针 。 (更 多 细节 请 参考 “事务 处 理性 能 委员 会 ”。) 一 般 来 
说 ， 性 能 基准 作为 一 种 广泛 的 数据 库 性 能 指标 可 能 有 用 ， 但 不 应 该 是 DBMS 选 型 时 的 唯一 决定 因素 。 许 多 TPC 基 准 遇 到 的 数据 库 
部 署 并 不 能 代表 大 多 数 的 生产 数据 库 系 统 ， 因 此 并 不 能 表明 特定 的 DBMS 的 实际 性 能 。 此 外 ， 基 准 也 在 不 断 更 新 ， 以 表明 每 种 主 
要 的 DBMS 产 品 新 的 改进 的 性 能 测量 ， 使 得 基准 的 “赢家 ”过 时 很 快 


基准 在 不 断 更 新 以 表明 新 的 和 改进 的 性 能 测量 。 


“ 可 扩展 性 。DBMS 支 持 你 准备 部 署 的 数据 库 规模 和 用 户 数量 吗 ? 大 型 数据 库 如 何 建立 、 支 持 和 维护 呢 ? 容易 还 是 痛苦 ?有 
独立 用 户 可 以 确认 DBMS 供 应 商 所 声称 的 可 扩展 性 吗 ? 


. 支持 软件 工具 的 可 用 性 。 你 所 要 求 的 支持 工具 在 该 DBMS 上 可 用 吗 ? 这 些 支持 工具 可 能 包括 : 查询 和 分 析 工 具 、 数 据 仓 库 
支持 工具 、 数 据 库 管理 工具 、 备 份 和 恢复 工具 、 性 能 监控 工具 、 容 量规 划 工 具 、 数 据 库 实用 工具 ， 以 及 支持 各 种 编程 语言 。 


* 技术 人 员 。 是 否 有 足够 熟练 的 DBMS 数 据 库 专 家 ? 考虑 有 关 DBA、 技 术 支 持 人 员 (系统 程序 员 和 管理 员 、 操 作 分 析 员 等 ) 
和 应 用 程序 编写 人 员 的 所 有 需求 。 


- 购置 成 本 。DBMS 的 总 购置 成 本 是 多 少 ? DBMS 供 应 商 疯狂 地 为 他 们 的 技术 收取 费用 ， 总 购置 成 本 应 该 结合 DBMS 的 许可 
证 成 本 ， 为 DBMS 编 程 、 提 供 支 持 、 提 供 管理 的 数据 库 专家 的 成 本 ， 操 作 DBMS 所 需 的 计算 资源 成 本 。 


* 发 布 计划 。DBMS 供 应 商 发 布 新 版 本 的 频率 如 何 ? 有 效 供应 商 的 发 布 周 期 很 快 ， 每 12~18 个 月 就 会 更 新 版 本 。 这 可 以 是 好 
事 也 可 以 是 坏事 ， 看 你 怎么 想 。 如 果 你 想 要 尖端 的 功能 ， 这 就 是 好 事 。 相 反 ， 如 果 你 所 在 的 企业 相对 保守 ， 那 么 会 难以 应 对 
DBMS 经 常 变化 。 快 速 发 布 周期 会 导致 那些 保守 的 企业 要 么 以 超过 它们 期 许 的 频率 更 新 DBMS， 要 么 使 用 过 时 的 DBMS 软 件 ， 但 
这 不 可 能 得 到 与 最 新 的 DBMS 软 件 相 同 水 平 的 支持 。 


- 参考 客户 。DBMS 供 应 商 是 否 提 供 当 前 的 用 户 参考 ? 靠 你 自己 能 否 找 到 可 以 给 出 相对 公允 答案 的 其 他 用 户 ? 与 当前 用 户 谈 
话 可 能 会 发 现 被 你 忽略 的 问题 和 关注 点 。 供 应 商 提 供 的 支持 如 何 ? 他 们 能 否 很 好 地 回应 问题 ? 使 用 效果 和 和 他们 所 宣传 的 一 致 吗 ? 
经 常会 有 许多 bug 修 复 必要 应 用 吗 ? 新 版 本 的 质量 如 何 ? 这 些 问 题 丽 怕 只 有 亲身 使 用 过 的 人 才能 回答 。 


事务 处 理性 能 委员 会 


事务 处 理性 能 委员 会 (TPC) 是 一 个 独立 的 、 非 盈利 性 组 织 ， 它 掌管 并 管理 着 性 能 基准 测试 。 它 的 使 命 是 定义 事务 处 理 和 数 
据 库 基准 ， 给 业界 提供 客观 的 、 可 验证 的 性 能 数据 。TPC 基 准 衡量 并 评估 电脑 的 功能 和 操作 。 


TPC 所 信奉 的 “事务 ”的 定义 是 偏 业务 的 。 典 型 的 TPC 事 务 包括 数据 库 为 某 些 事情 而 做 的 更 新 ， 比 如 ， 库 存 控制 〈 货 物 ) 、 
飞机 票 预 订 (服务 ) 和 银行 业 ( 货 币 ) 。 


TPC 产 生 的 基准 衡量 性 能 的 依据 是 : 在 单位 时 间 内 ， 一 个 给 定 的 系统 和 数据 库 可 以 执行 多 少 事务 ,例如 ， 每 秒 的 事务 数量 。 
TPC 定 义 了 三 种 基准 : 


TPC-C， 交 易 环 境 中 计划 的 生产 工作 量 。 


TPC-H， 决 策 支持 基准 ， 由 一 系列 面向 业务 的 随机 查询 和 并 发 的 数据 修改 组 成 。 


- TPC-E， 一 种 更 新 的 OLTP 工 作 量 (基于 金融 事务 处 理 ) 。 
有 关 这 些 基准 的 更 多 信息 和 深层 次 定义 请 参考 TPC 的 网 站 : www.tpc.org ( 详 见 图 2-1) 。 


DBMS 选 型 一 定 要 考虑 产品 的 复杂 性 。DBM 软件 一 般 都 比较 复杂 且 随 着 每 一 个 新 版 本 的 发 布 会 变 得 越 来 越 复杂 。 过 去 通过 
附加 软件 或 独立 程序 才 支 持 的 功能 也 越 来 越 多 地 添加 到 DBMS 的 功能 特征 中 ， 如 图 2-2 所 示 。 你 需要 规划 并 支持 所 有 这 些 功能 特 
征 。 因 为 即使 目前 没有 某 些 特定 功能 的 需求 ， 一 旦 部 署 DBMS， 程 序 员 和 开发 人 员 也 会 找到 理由 来 使 用 这 些 供应 商 添加 的 所 有 功 
能 。 所 以 做 好 规划 和 准备 总 比 事先 没有 规划 而 直接 使 用 更 好 些 
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图 2-2 DBMS 软 件 的 功能 与 特征 的 集成 
[1 如 果 你 更 喜欢 开源 的 商业 软件 ， 一 些 NoSQL 的 商业 产品 可 供 选 择 。 例 如 ，DataStax 就 是 基于 Cassandra 的 。 
2.1.2 ” DBMS 架构 


DBMS 环 境 的 支撑 架构 对 数据 库 应 用 程序 的 成 功 至 关 重 要 。 一 个 错误 的 选择 或 整体 架构 的 某 个 组 件 部 署 错误 都 会 导致 应 用 程 
序 性 能 低 、 停 机 或 不 稳定 。 


DBMS 环 境 的 支撑 架构 对 数据 库 应 用 程序 的 成 功 至 关 重 要 。 

以 大 型 机 为 主 的 企业 计算 ， 当 时 单纯 关注 DBMS 架 构 即 可 。 一 切 都 运行 在 大 型 机 上 ， 事 实 如 此 。 然 而 ， 当 今 的 IT 基 础 设施 是 
分 布 式 的 和 异 构 的 ， 整 体 架 构 (即使 是 大 型 机 DBMS) 也 可 能 由 多 个 平台 和 互 操作 系统 软件 组 成 。 由 业务 和 IT 专家 组 成 的 团队 ， 
而 不 是 个 人 或 单个 组 ， 来 制定 最 终 的 架构 决策 。 业 务 专家 应 包括 来 自 各 部 门 的 代表 ， 以 及 负责 软件 合同 问题 的 会 计 和 法 律 部 门 。 
除了 数据 库 管 理 代 表 (DA、DBA 和 SA) ， 网 络 组 成 员 、 操 作 系统 专家 、 经 营 管理 人 员 、 编 程 专家 ， 以 及 其 他 任何 相关 人 员 ， 都 
应 在 这 个 团队 中 。 


此 外 ， 要 确保 所 选 的 DBMS 适 合计 划 部 署 处 理 的 性 质 和 类 型 。DBMS 架 构 有 四 个 级 别 : 企业 、 部 门 、 个 人 和 移动 。 


企业 DBMS 是 专 为 可 扩展 性 和 高 性 能 而 设计 的 。 企 业 DBMS 必 须 能 够 支持 非常 大 型 的 数据 库 、 大 量 的 并 发 用 户 和 多 种 类 型 的 
应 用 程序 。 它 运行 在 大 型 机 器 上 ， 通 常 是 主机 或 运行 UNIX、Linux 或 Windows 服 务 器 的 高 端 服务 器 。 此 外 ， 企 业 DBM S 提 供 了 
来 自 DBBMS 供 应 商 的 所 有 附加 功能 。 多 处 理 器 支持 、 支 持 并 发 查询 以 及 其 他 高 级 DBMS 功 能 ， 都 是 企业 DBMS 的 核心 组 成 部 分 。 


DBMS 架 构 有 四 个 级 别 : 人 企业、 部门、 个 人 和 移动 。 


部 门 DBMS 有 时 也 称 作 工 作 组 DBMS， 服 务 于 中 间 地 带 。 它 为 组 织 内 部 的 小 到 中 等 规模 的 工作 组 提供 支持 ， 通 常情 况 下 ， 运 
行 在 UNIX、Linux 或 Windows 服 务 器 上 。 部 门 数据 库 服 务 器 和 企业 数据 库 服务 器 之 间 的 分 界线 不 是 很 明显 。 通 过 软 硬 件 升级 可 


以 让 部 门 DBMS 处 理 任务 ， 之 前 这 些 任务 可 能 只 由 企业 DBMS 执 行 。 部 门 软 硬 件 组 件 成 本 的 稳步 下 降 还 有 助 于 降低 运营 的 总 成 
本 ， 并 扩展 工作 组 环境 以 服务 于 整个 企业 。 


个 人 DBMS 专 为 个 人 用 户 设计 ， 通 常用 于 中 低 端 Powered PC 平台 。Microsoft Access、SQLite 和 FileMaker [1] 都 是 个 人 数 
据 库 软件 的 例子 。 当 然 ， 主 要 DBMS 供 应 商 也 销售 功能 更 强大 的 解决 方案 的 个 人 版 本 ， 如 Oracle 数 据 库 个 人 版 和 DB2 个 人 版 。 有 
时 个 人 DBMS 的 低 成 本 会 误导 人 试图 为 部 门 或 企业 解决 方案 选择 个 人 DBMS。 然 而 ， 不 要 经 不 起 低 成 本 的 诱惑 ， 个 人 DBMS 产 品 
只 适用 于 规模 非常 小 的 项 目 ， 多 用 户 应 用 程序 绝对 不 可 部 署 。 


最 后 ， 移 动 DBMS 是 部 门 或 企业 DBMS 的 特别 版 本 ， 专 为 那些 不 常 接 入 网 络 的 远程 用 户 设 计 。 移 动 DBMS 人 允许 通过 笔记 本 电 
脑 或 手持 设备 访问 和 修改 本 地 数据 库 ， 此 外 ， 它 还 提供 了 将 远程 数据 库 更 改 同步 到 一 个 集中 的 企业 或 部 门 数据 库 服务 器 的 一 种 机 
制 。 


为 一 种 类 型 的 事务 处 理 而 设计 的 DBMS 可 能 不 适合 其 他 用 途 。 例 如 ,个 人 DBMS 不 是 为 多 用 户 设 计 的 ， 而 企业 DBMS 对 于 个 
人 用 户 来 说 一 般 太 复杂 。 务 必 弄 清楚 企业 、 部 门 、 个 人 和 移动 DBM 软件 之 间 的 区 别 ， 然 后 选择 适合 你 的 特定 数据 处 理 需求 的 
DBMS。 可 能 需要 选择 多 个 DBMS 类 型 一 一 每 个 级 别 选 一 个 DBMS 一 一 具体 使 用 则 由 每 个 开发 项 目的 需求 来 定 。 


如 果 你 的 企业 需要 不 同 级 别 的 DBMS， 那 么 尽 可 能 从 同一 家 供应 商 选择 一 组 DBMS 解 决 方案 会 是 不 错 的 选择 。 这 么 做 有 助 于 
减少 访问 、 开 发 和 管理 时 的 差异 。 例 如 ， 如 果 你 的 企业 使 用 Oracle 的 企业 DBMS， 那 就 不 妨 选择 Oracle 的 个 人 版 来 满足 个 人 用 
户 DBMS 的 需求 。 


[1] 专业 的 、 多 用 户 版 本 也 提供 FileMaket。 


2.1.3 DBMS 集 群 


集群 是 利用 多 个 “独立 的 ”计算 系统 作为 单一 的 、 高 度 可 用 的 系统 一 同 工 作 。 现 代 DBMS 提 供 集 群 支持 用 以 提高 可 用 性 和 可 
扩展 性 。 集 群 的 两 种 主要 架构 是 磁盘 共享 和 无 共享 ， 这 些 命 名 至 少 在 一 定 水 平 上 很 好 地 描述 了 架构 的 本 质 。 

现代 DBMS 提 供 集群 支持 用 以 提高 可 用 性 和 可 扩展 性 。 

无 共享 集群 如 图 2-3 所 示 。 在 这 种 架构 中 ， 每 个 系统 都 有 属于 各 自 的 资源 (AR. BES) 。 集 群 处 理 器 是 通过 连接 计算 机 
的 网 络 传 递 信 息 来 沟通 的 。 此 外 ， 来 自 客户 端的 请 求 自动 被 路 由 至 拥有 所 请 求 资源 的 系统 。 每 次 只 有 一 个 集群 系统 可 以 “ 拥 


有 ”并 访问 特定 的 资源 。 当 发 生 故 障 时 ， 资 源 所 有 权 可 以 自动 转移 到 集群 中 的 其 他 系统 。 无 共享 集群 的 主要 优势 是 它 的 可 扩展 
性 ,理论 上 ， 一 台 无 共享 的 多 处 理 器 可 以 扩展 至 上 干 台 处 理 器 ， 因 为 它们 相互 之 间 互 不 干涉 ， 即 没有 共享 。 


/ 互联 网 络 


REl ii 
A2-3 ”无 共享 架构 
无 共享 集群 的 主要 优势 是 可 扩展 性 。 


共享 磁盘 集群 更 适用 于 大 型 机 环境 中 的 大 规模 企业 处 理 。 
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在 共享 磁盘 环境 中 ， 所 有 连接 的 系统 共享 同一 个 磁盘 设备 ， 如 图 2-4 所 示 。 每 个 处 理 器 仍然 有 自己 独立 的 内 存 ， 但 所 有 的 处 
理 器 都 可 以 直接 寻 址 所 有 的 磁盘 。 通 常情 况 下 ， 共 享 磁盘 集群 不 为 较 小 的 机 器 扩展 ， 这 与 无 共享 集群 不 同 。 共 享 磁盘 集群 更 适用 
于 大 型 机 环境 中 的 大 型 企业 处 理 。 大 型 机 (特别 是 非常 大 的 处 理 器 ) 能 处 理 大 量 的 工作 ， 只 有 少数 集群 大 型 机 就 可 以 获得 很 大 的 


收益 ， 而 多 台 PC 和 中 型 处 理 器 一 起 才能 实现 类 似 的 收益 。 


图 2-4 共享 磁盘 架构 
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共享 磁盘 集群 通常 更 适用 于 只 需要 适度 共享 访问 数据 的 应 用 程序 和 服务 ， 以 及 难以 分 区 的 应 用 程序 或 工作 负载 。 有 大 量 数 据 


更 新 需求 的 应 用 程序 可 能 更 适合 部 署 无 共享 集群 。 表 2-3 比 较 了 共享 磁盘 和 无 共享 这 两 种 架构 的 能 力 。 


表 2-3 ”共享 磁盘 与 无 共享 架构 的 比较 


共享 磁盘 无 共 享 
快速 适应 不 断 变 化 的 工作 负载 可 利用 更 简单 、 更 便宜 的 硬件 
高 适应 性 几乎 无 限 的 可 扩展 性 
大 量 读 操 作 环境 下 表现 最 好 高 容量 的 读 写 操作 环境 下 运转 良好 
数据 不 需要 分 区 抄 个 集群 的 数据 需要 分 区 


主要 DBMS 供 应 商都 提供 支持 不 同类 型 且 具 有 不 同 能 力 和 需求 的 集群 。 例 如 ， 用 于 z/OS 的 DB2 提 供 共享 磁盘 集群 ， 具 有 数 
据 共享 和 并 行 系统 综合 体 的 能 力 ; 非 大 型 机 平台 的 DB2 则 使 用 无 共享 集群 ; Oracle 的 Real Application Clusters 提 供 共享 磁盘 集 
群 。 


对 于 大 多 数 用 户 来 说 ， 集 群 的 主要 好 处 是 增强 可 用 性 ， 这 归结 于 组 合 处 理 器 。 在 某 些 情况 下 ， 集 群 可 以 帮 企 业 达到 99.999% 
的 可 用 性 。 此 外 ， 集 群 可 用 于 负载 均衡 和 容错 。 


2.14 DBMSiziii 


作为 一 个 经 验 法 则 ， 创 建 策略 必须 要 赶 在 企业 引入 新 的 DBMS 之 前 ， 否 则 会 导致 不 同 的 DBMS 产 品 泛滥 ， 从 而 难以 支持 。 也 
会 造成 困惑 ， 如 哪个 部 署 使 用 哪个 DBMS。 


不 同 DBMS 产 品 的 泛滥 可 能 难以 支持 。 


正如 前 面 提 到 的 ，DBMS 供 应 商 过 剩 且 各 自 贩卖 各 自 的 产品 。 作 为 DBA， 你 势必 会 遭受 市 场 和 销售 人 员 的 狂 码 小 炸 ， 试 图 说 
服 你 使 用 他 们 的 DBMS。 一 定 要 打住 ， 除 非 他 们 能 给 出 非常 有 吸引 力 的 理由 ， 并 提供 短期 投资 回报 率 (ROI) 的 证 明 。 即 使 有 正 
当 的 理由 且 ROI 良 好 ， 也 要 仔细 推 项 他 们 所 说 的 以 及 ROI 的 计算 方法 。 有 时 一 些 理由 是 过 时 的 且 没 有 考虑 周全 ROI， 如 额外 的 管 
理 成 本 。 


记 住 ， 每 个 DBM SS 都 需要 数据 库 管 理 支持 。 此 外 ， 每 个 DBMS 使 用 不 同 的 方法 来 执行 类 似 的 任务 。 因 此 ， 安 装 的 DBMS 产 品 
越 少 ， 数 据 库 管理 越 简单 ， 为 企业 提供 有 效 的 数据 管理 资源 的 机 会 就 越 好 。 


2.1.5 ”硬件 问题 


建立 应 用 开发 的 数据 库 环 境 时 ，DBMS 选 型 只 是 整个 工程 的 一 部 分 。 未 来 DBM 以 运行 的 硬件 和 操作 系统 会 极 大 地 影响 数据 
库 环境 的 可 靠 性 、 可 用 性 和 可 扩展 性 (RAS) 。 例 如 ， 运 行 Z/OS 的 大 型 机 平台 IBM zEC12 与 一 个 运行 AIX 的 中 档 I1BM xSeries 设 
备 相 比 ， 前 者 可 能 会 提供 更 高 的 RAS， 而 后 者 却 可 能 会 超过 运行 Windows 的 Dell 服 务 器 。 这 并 不 是 说 一 切 都 应 运行 在 大 型 机 
上 ， 而 必须 还 要 考虑 其 他 问题 ， 如 成 本 、 体 验 、 可 管理 性 以 及 所 要 开发 的 应 用 程序 的 需求 。 底 线 是 确保 将 硬件 平台 和 操作 系统 这 
些 限制 因素 计 入 DBM S 选 型 的 标准 。 


将 硬件 平台 和 操作 系统 这 些 限 制 因素 计 入 DBMS 选 型 的 标准 。 


2.1.6 BREA 


云 计算 ( 见 “ 云 计算 概述 ”) 应 用 越 来 越 多 广泛 ， 特 别 是 在 中 小 型 企业 中 。 与 建立 一 整套 需要 管理 和 支持 的 本 地 计算 基础 设 
施 相 比 ， 云 服务 部 署 的 成 本 效益 可 能 更 好 。 


云 数据 库 系 统 通过 互联 网 提供 DBMS 服 务 。 权 衡 本 质 上 归结 为 信任 将 数据 的 存储 和 管理 任务 交 由 云 服务 提供 商 ， 作 为 企业 帮 
助 减少 数据 库 管 理 和 维护 成 本 和 精力 的 回报 。 使 用 云 数据 库 系 统 可 以 使 企业 ， 尤 其 是 规模 较 小 且 没 有 资源 在 企业 计算 基础 设施 上 
投资 的 企业 ， 专 注 自己 的 业务 而 不 用 担心 他 们 的 计算 环境 。 

通过 整合 云 数据 源 ， 可 能 会 促进 合作 伙伴 、 分 支 机 构 、 远 程 工作 人 员 和 移动 设备 之 间 的 协作 ， 因 为 作为 一 种 服务 ， 使 得 数据 
变 得 更 容易 访问 。 不 需要 安装 、 设 置 、 打 补丁 或 管理 DBMS 软 件 ， 因 为 这 些 管理 任务 都 由 云 服务 提供 商 掌 管 和 关心 。 不 足 之 处 
是 ， 你 的 数据 现在 由 一 个 外 部 代理 云 服 务 提供 商 存 储 和 控制 。 云 计算 的 另 一 种 固有 风险 是 可 能 会 有 一 些 不 法 代理 商 假装 合法 用 
z 


o 


云 数据 库 平台 的 例子 是 Microsoft SQL Azure， 它 建立 在 SQL Server 技 术 的 基础 之 上 ， 是 Windows Azure 平 台 的 一 个 组 成 


Boy. 


OK 


云 计 算 概述 
在 较 高 层次 上 ， 云 计算 是 作为 一 种 服务 而 提供 的 计算 。 云 计算 应 用 程序 依赖 网 络 (通常 是 互联 网 ) 为 用 户 提供 共享 资源 、 软 
件 和 数据 。 有 了 云 计算 ,计算 机 系统 和 应 用 程序 的 作用 都 应 像 公共 事业 提供 商 (如 电网 ) 一 样 。 


云 一 词 用 来 比喻 互联 网 ， 这 基于 在 绘制 基础 设施 图 时 常 倾向 于 将 网 络 访问 画作 一 个 抽象 的 “ 云 ”。 这 方面 的 例子 可 参考 本 书 


第 1 章 的 图 1-11。 


从 DBMS 的 角度 来 看 ， 云 计算 将 数据 及 其 管理 从 本 地 的 计算 环境 移 走 ， 并 通过 互联 网 将 计算 作为 一 种 服务 来 提供 。 


一 旦 选 定 DBMS， 接 下 来 就 是 安装 了 。 安 装 DBM 9 并 不 像 直 接 将 CD 放 进 光驱 让 软件 自行 安装 (或 者 对 于 使 用 大 型 机 的 人 来 
说 ， 只 是 通过 IEBGEBER 从 磁带 复制 ) 一 样 简单 。 DBMS 是 一 种 复杂 的 软件 ， 需 要 前 期 规划 安装 才能 成 功 。 你 将 需要 了 解 新 的 
DBMS 的 需求 并 为 之 准备 环境 。 


2.2.1 DBMS 安 装 基础 


第 一 次 安装 一 个 DBMS 时 ， 首 先 要 做 的 就 是 了 解 安 装 的 先决 条 件 。 每 个 DBMS 都 自 带 一 本 安装 手册 或 指南 ， 其 中 包含 了 
DBMS 正 常 运作 必须 满足 的 运行 要 求 。 这 些 先 决 条 件 包括 : 确保 在 用 的 操作 系统 的 版 本 适当 ， 确 认 有 足够 的 内 存 来 支持 DBMS， 
并 确保 任何 要 使 用 的 、 与 DBMS 相 关 的 软件 都 有 正确 的 版 本 和 维护 水 平 。 


从 头 到 尾 阅读 安装 指南 。 


一 旦 满足 了 基本 条 件 ， 接 下 来 就 是 从 头 到 尾 阅 读 安装 指南 。 务 必 做 到 的 是 ， 在 安装 DBMS 前 就 已 经 了 解 整个 安装 过 程 。 安 装 


DBMS 前 有 大 量 的 准备 工作 需要 做 ,认真 阅读 以 确保 能 够 成 功 安装 。 审 查 DBMS 的 安装 程序 或 例 行 程序 是 如 何 运 作 的 ， 并 遵从 
DBMS 软 件 的 安装 指南 中 提供 的 明确 指示 。 此 外 ， 初 次 安装 时 可 能 要 与 DBMS 供 应 商 密切 合作 ， 以 确保 你 的 计划 是 合理 的 。 某 些 
情况 下 ， 与 本 地 的 、 有 经 验 的 供应 商 或 顾问 合作 有 助 于 避免 安装 和 配置 错误 。 


本 节 的 其 余部 分 将 讨论 一 些 DBMS 安 装 前 必需 的 常见 准备 工作 。 如 果 DBMS 已 经 在 运行 ， 且 你 打算 将 其 升级 到 一 个 新 版 本 ， 
请 参阅 2.3 节 。 


2.2.2 ”硬件 需求 


每 个 DBMS 都 有 基本 的 CPU 需 求 ， 即 满足 DBMS 运 行 所 需 的 CPU 版 本 和 最 低 处 理 速 度 。 此 外 ， 一 些 DBMS 指 定 了 所 需 的 或 不 
支持 的 硬件 型 号 。 通 常情 况 下 ，CPU 的 标准 将 满足 Intel 环 境 的 需要 ， 但 在 大 型 机 或 企业 服务 器 环境 中 ， 根 据 支持 的 DBMS 功 能 
不 同 机 器 型 号 会 有 所 不 同 。 例 如 ， 如 果 有 可 用 的 固件 ， 某 些 机 器 的 内 置 固件 可 以 为 DBMS 所 用 .。 


根据 需要 选择 正确 的 DBMS 且 硬件 要 与 DBMS 需 求 相 匹 配 。 


此 外 ， 每 个 DBMS 为 特定 需求 提供 了 不 同 “ 口 味 ” 的 软件 。 (我 使 用 了 “口味 ”而 不 是 “版 本 ”或 “发 布 ”， 表 示 同 一 
DBMS 的 不 同 重复 。) DBMS 的 不 同 口味 (同一 版 本 级 别 ) 对 一 些 特定 环境 可 用 ， 比 如 ， 并 行 处 理 、 普 适 计算 技术 (如 手持 设 
备 ) 、 数 据 仓库 或 移动 计算 。 一 定 根据 需要 选择 正确 的 DBMS， 且 硬件 与 DBMS 的 需求 相 匹 配 。 


223 存储 需求 


DBMS 需 要 磁盘 存储 来 运行 ， 不 仅 是 为 了 创建 存储 数据 的 数据 库 ， 还 因为 数据 库 中 定义 的 索引 以 及 : 


`- DBMS 管 理 和 跟踪 数据 库 及 相关 信息 所 使 用 的 系统 目录 或 数据 词典 。 计 划 创 建 的 数据 库 对 象 越 多 ， 系 统 目录 所 需 的 存储 规 
模 越 大 。 


* 任何 DBMS 所 需 的 其 他 系统 数据 库 ， 例如， 支持 分 布 式 连接 或 管理 的 工具 。 


日志 文件 ， 记 录 每 个 数据 库 所 做 的 一 切 更 改 ， 包 括 活动 日 志 、 归 档 日 志 、 回 滚 段 以 及 DBMS 所 需 的 任何 其 他 类 型 的 更 改 日 


Gir 


- DBMS 启 动 或 初始 化 时 必须 访问 的 启动 或 控制 文件 。 


© DBMS 为 数据 排序 或 其 他 处 理 需 要 而 使 用 的 工作 文件 。 


" 默认 数据 库 为 DBMS 系 统 结 构 所 用 ， 或 者 在 新 数据 库 对 象 创建 时 作为 默认 的 垃圾 桶 。 


- DBMS (或 访问 数据 库 的 应 用 程序 ) 因 瞬 态 数 据 而 使 用 的 临时 数据 库 结 构 ， 瞳 态 数 据 即 那些 不 需要 长 久 但 在 操作 过 程 ( 如 
Microsoft SQL Servet 重 建 集群 索引 ) 中 需要 保留 存储 的 数据 。 


“ 系统 转 储 和 错误 处 理 文件 。 


* 用 于 管理 、 监 控 和 调 优 的 DBA 数 据 库 ， 例 如 ， 用 于 测试 新 版 本 、 迁 移 脚本 等 的 DBA 数 据 库 。 


一 定 要 考虑 DBMS 的 每 个 仓储 需求 并 预 留 适 当 的 存储 空间 。 此 外 还 请 注意 DBM3 将 同时 使 用 其 中 一 些 数 据 库 和 文件 结构 。 
此 ， 计 划 使 用 多 个 存储 设备 是 个 不 错 的 主意 ， 即 使 不 会 全 部 使 用 它们 的 空间 。 合 适 的 数据 库 和 文件 放置 位 置 会 使 DBMS 更 有 效 地 
运作 ， 因 为 访问 数据 时 ， 并 行 活动 不 会 受到 物理 磁盘 的 限制 。 


考虑 DBMS 的 每 个 存储 需求 并 预 留 适 当 的 存储 空间 。 


磁盘 存储 不 是 DBMS 的 唯一 需求 ， 一 些 任务 如 数据 库 备份 和 日 志 抒 载 还 需要 磁带 或 光盘 (如 DVD 和 CD) 。 活 动 日 志 写 满 
时 ， 要 将 日 志 记 录 镍 载 到 磁盘 或 磁带 上 的 归档 日 志 ， 如 图 2-5 所 示 。 根 据 所 用 的 DBMS 和 激活 的 功能 的 不 同 ， 这 一 过 程 可 以 是 自 
动 的 也 可 以 是 手动 的 。 归 档 日 志文 件 必 须 保留 以 作 恢 复 ， 即 使 最 初 是 存储 在 磁盘 上 的 ， 最 终 也 要 转移 到 外 部 的 存储 设备 并 妥善 保 


DBMS 


活动 日 志 ie 
| s 
Aea o | 
/ 磁带 或 DVD/CD 
a ~ 
| Ley tS 
F i \ | 
— | ) \ 
| ed 
Ne A A 
归档 日 志 
图 2-5 HERR 


计划 维护 多 个 磁带 或 CD/DVD 光 碟 机 ， 以 使 DBMS 能 够 并 发 运行 多 个 进程 (需要 外 部 存储 ) ， 如 并 发 数据 库 备 份 。 而 如 果 数 
据 库 备份 工作 单线 程 使 用 单一 的 驱动 ， 可 能 会 发 生 数据 库 中 断 。 
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关系 DBM S 也 喜欢 内 存 ， 与 其 他 数据 库 和 应 用 程序 一 样 。DBMS 的 基本 功能 需要 内 存 且 用 于 处 理 大 部 分 的 内 部 进程 ， 如 维护 
系统 的 全 局 区 域 以 及 执行 大 量 DBMS 任 务 。 


为 避免 /MO，DBMS 需 要 大 量 的 内 存 以 在 内 存 结构 中 缓 仓 数 据 。 从 磁盘 存储 设备 读 取 数据 通常 比 在 内 存 中 移动 数据 更 昂贵 且 
更 慢 。 图 2-6 显 示 了 DBMS 如 何 使 用 称 作 绥 冲 池 或 数据 缓存 的 内 存 结构 来 减少 物理 /OO 请求。 通过 将 读 取 进 缓冲 池 的 数据 缓存 ， 
只 要 数据 留 在 缓冲 池 ，DBMS 就 可 以 避免 由 于 对 相同 数据 的 后 续 请 求 而 带 来 的 /OQ。 一 般 来 说 ， 缓 冲 池 越 大 ， 数 据 在 内 存 保留 的 


时 间 就 越 义 ， 且 整体 的 数据 库 处 理 执行 得 就 越 好 。 


see sos 程序 
(1) 程序 请 求 一 行 数据 1 


(4) 以 及 程序 


(5) 对 同一 行 数据 


(2) CBMS 找 到 请 求 能 
RAREN 作出 后 续 请 求 


数据 
(6) DBMS 从 缓冲 池 | 
PARE E pair H _ 
os 找到 请 求 的 数据 缓冲 池 程序 
a 2 
C 2 


(3) 并 将 它 移 至 缓冲 池 


(7) 并 将 数据 移 至 程序 而 


be a Y 不 从 磁盘 读 取 


数据 库 


图 2-6 ”缓冲 池 (或 数据 缓存 ) 


除了 数据 ，DBM SS 还 在 内 存 缓存 其 他 结构 。 大 多 数 DBMS 预 留 内存 用 以 存储 DBM SS 处理 数 据 库 请 求 所 需 的 程序 结构 。 [1] 程 
序 缓存 存储 的 数据 有 “编译 了 的 ”SQL 语句 、 数 据 库 授权 以 及 程序 执行 时 需要 的 数据 库 结构 块 。 一 旦 缓存 这 些 结构 ， 就 可 以 优化 
数据 库 处 理 ， 因 为 可 以 避免 从 物理 存储 设备 访问 它们 的 那些 /MO 请 求 了 。 


DBMS 需 要 内 存 通常 是 为 了 支持 其 他 功能 ， 比 如 ， 人 处理 锁 定 请 求 、 促 进 分 布 式 数据 请 求 、 数 据 排序 、 优 化 进程 和 处 理 SQL 语 
I. 


确保 DBMS 有 非常 充足 的 内 存 供 其 使 用 ， 这 有 助 于 优化 数据 库 处 理 以 及 减少 潜在 的 问题 。 
确保 DBMS 有 非常 充足 的 内 存 供 其 使 用 。 


[1] 在 DB2 中 ， 用 在 内 存 缓存 程序 结构 的 区 域 称 为 EDM 池 。 在 SQL Servefr 中 它 叫 做 SQL 缓存 ， 而 在 Oracle 中 使 用 两 种 结构 : PGA 和 
SGA 的 共享 池 。 


2.2.5 ”配置 DBMS 


配置 DBMS 的 系统 参数 可 以 控制 DBMS 以 何 种 方式 起 作用 ， 也 可 以 控制 提供 给 它 的 可 用 资源 。 [1 每 个 DBMS 人 允许 以 不 同方 
式 修改 其 系统 参数 ， 但 在 安装 过 程 通常 会 以 单 选 按 钮 、 菜 单 或 面板 选择 的 方式 来 设置 DBMS 的 系统 参数 。 在 此 过 程 中 ， 提 供给 安 


装 脚本 的 输入 将 会 用 于 建立 系统 参数 的 初始 值 。 
每 个 DBMS 还 提供 了 一 种 方法 ， 可 以 在 DBMS 运 行 时 改变 系统 参数 。 


每 个 DBMS 还 提供 了 一 种 方法 ， 可 以 在 DBMS 运 行 时 改变 系统 参数 。 有 了 时 可 以 使 用 DBMS 命 令 来 设置 系统 的 参数 ， 有 时 则 必 
须 编辑 包含 当前 系统 参数 设置 的 文件 。 如 果 必 须 编辑 文件 ， 一 定 要 非常 小 心 ， 因 为 一 个 错误 的 系统 参数 设置 对 DBMS 的 运行 状态 
可 能 就 是 致命 的 。 

那么 系统 参数 是 控制 什么 的 ? 举 两 个 例子 ， 系 统 参数 控制 着 DBA 对 DBMS 的 授权 以 及 活动 的 数据 库 日 志 的 数量 ; 系统 参数 设 
置 用 于 数据 和 程序 缓存 的 内 存 大 小 ， 并 打开 或 关闭 某 些 DBMS 功 能 。 尽 管 每 个 DBM S 都 有 系统 参数 来 控制 它 的 功能 ， 但 每 个 
DBMs 设 置 和 改变 值 的 方法 却 不 尽 相同 。 并 且 ， 实 际 上 每 个 DBM S 通 过 使 用 系统 参数 来 设置 的 参数 也 不 同 。 

安装 数据 库 系 统 软件 时 ， 谨 防 一 味 地 使 用 默认 系统 参数 。 尽 管 这 么 做 会 节约 时 间 从 而 使 安装 变 得 更 简单 ， 但 这 可 能 会 导致 后 
续 问 题 。 从 长 远 来 看 ， 大 多 数 DBMS 使 用 默认 设置 的 表现 不 佳 ， 并 且 在 某 些 情况 下 性 能 还 可 随时 间 亚 化， 因为 在 安装 或 设置 时 没 
有 预先 分 配 资源 。 

一 定 要 充分 了 解 你 的 DBMS 所 使 用 的 参数 ， 否 则 可 能 导致 数据 库 环境 配置 不 当 ， 进 而 导致 性 能 问题 、 数 据 完 整 性 问题 ， 甚 至 
DBMS 失 败 。 


[1] 在 DB2 中 ， 系 统 参数 通过 汇编 DSNZPARM 成 员 来 设置 ; SQL Server 使 用 SP_CONFIGURE 系 统 程序 来 设置 系统 参数 ; Oracle 中 
的 参数 使 用 INIT.ORA 来 控制 。 


2.2.6 连接 DBMS 与 基础 设施 配套 软件 


DBMS 安 装 过 程 的 部 分 内 容 是 将 DBMS 和 与 之 相互 作用 的 其 他 系统 软件 组 件 连接 起 来 。 典 型 的 基础 设施 软件 可 能 需要 进行 配 
置 才能 与 DBBMS 一 起 工作 ， 包 括 网 络 、 进 程 监视 器 、 消 息 队 列 、 其 他 类 型 的 中 间 件 、 编 程 语言 、 系 统管 理 软 件 、 运 营 与 作业 控制 
软件 、 网 络 服务 器 和 应 用 程序 服务 器 。 


每 款 基础 设施 配套 软件 与 DBMS 配 合 的 需求 都 不 尽 相 同 。 


每 款 基础 设施 配套 软件 与 DBBMS 配 合 的 需求 都 不 尽 相 同 。 典 型 的 配置 过 程 可 能 包括 安装 DLL 文 件 ， 创 建新 的 参数 文件 以 建立 
连接 ， 并 可 能 重新 访问 配套 软件 的 安装 程序 来 安装 与 DBMS 交 互 所 需 的 组 件 。 


2.2.7 ”安装 验证 


DBMS 安 装 完成 后 ， 还 应 该 进行 电池 测试 以 验证 DBMS 是 否 已 经 正确 地 安装 和 配置 。 大 多 数 DBM S 供 应 商都 提供 了 用 于 此 目 
的 的 示例 程序 和 安装 验证 程序 。 此 外 ， 你 还 可 以 通过 测试 DBMS 的 标准 接口 来 确保 正确 安装 。 大 多 DBMS 所 支持 的 标准 接口 是 一 
个 互动 的 SQL 接口 ， 通 过 它 可 以 直接 向 DBMS 提 交 SQL 语 句 。 | 


创建 一 组 由 SELECT、INSERT、UPDATE 和 DELETE 组 成 的 SQL 代码 ， 并 针对 样本 数据 库 发 出 。 安 装 完 成 后 运行 这 样 的 脚本 
有 助 于 验证 DBM 安装 是 否 正确 ， 能 否 如 预期 般 操 作 。 


此 外 ， 一 定 要 验证 配套 支持 软件 的 所 有 必需 连接 都 能 够 运行 且 运 转正 常 。 如 果 DBMS 供 应 商 没有 提供 示例 程序 ， 你 可 能 需 


为 每 个 环境 创建 并 运行 简单 的 测试 程序 以 确保 配套 软件 的 连接 都 可 以 和 DBM 一 起 正常 工作 。 


[1] 在 DB2 中 ，SQL 接 口 指 SPUFI，IBM 还 提供 基于 GUI 的 SQL 创建 和 提交 的 数据 套件 (Data Studio) o SQL Server 调 用 接口 ISQL， 
而 用 Oracle 时 ， 你 可 以 选择 使 用 Oracle 企 业 管 理 器 中 的 SQL*Plus 或 者 SQL Wotksheet 进 行 SQL 提交 。 


2.2.8 ” DBMS 环境 


一 般 来 说 ， 安 装 DBMS 涉 及 的 不 仅 是 安装 一 个 实例 或 子 系统 那样 简单 。 为 了 支持 数据 库 开发 ，DBA 需 要 创建 多 个 DBMS 环 
境 ,例如 ,测试 、 质 量 保证 、 集 成 和 生产 工作 。 当 然 ， 在 同一 个 DBMS 实 例 中 支持 多 个 环境 也 是 可 能 的 ， 只 是 此 做 法 不 慎重 。 安 
装 多 个 DBMS 要 好 于 单个 数据 库 支 持 多 个 开发 环境 ， 这 最 大 程度 地 减少 了 迁移 问题 ， 也 不 需要 复杂 的 数据 库 命 名 约定 。 此 外 ， 分 
离 数据 库 实例 使 测试 、 调 优 和 监控 变 得 更 简单 。 


2.3 ”升级 DBMS 的 主 版 本 和 次 版 本 


变更 是 个 不 争 的 事实 ,主流 DBMS 产 品 的 变更 相当 快 。 通 过 在 主要 版 本 间 交 付 恒定 的 错误 修复 和 维护 更 新 ，DBMS 软 件 主要 
版 本 的 典型 发 布 周期 是 18~24 个 月 。 实 际 上 ， 需 要 设置 全 职 岗位 来 保持 DBMS 软 件 的 版 本 最 新 。 


变更 是 个 不 争 的 事实 。 


DBA 必 须 开 发 一 种 升级 DBM 软件 的 方法 ， 既 要 符合 企业 的 需要 ， 又 能 最 大 程度 地 减少 由 于 停电 和 数据 库 不 可 用 而 带 来 的 业 
务 中 断 。 


你 可 能 已 经 注意 到 ， 本 书 交 叉 使 用 了 主 版 本 和 次 版 本 。 宽 泛 地 讨论 DBMS 的 升级 固然 很 好 ， 但 更 精确 的 定义 也 是 必要 的 。 有 
关 主 版 本 和 次 版 本 之 间 差 异 的 更 详细 讨论 ， 请 参阅 “ 主 版 本 或 次 版 本 ”。 


DBMS 的 版 本 升级 可 以 认为 是 新 的 安装 过 程 的 一 种 特殊 情况 。 安 装 过 程 所 需 的 所 有 程序 都 适用 于 版 本 升级 : 必须 规划 适当 的 
资源 ， 考 虑 所 有 系统 参数 ， 并 确保 所 有 的 配套 软件 都 已 经 连接 到 位 。 然 而 ， 还 有 另外 一 个 严肃 的 问题 必须 规划 好 : 现 有 的 用 户 与 
应 用 程序 。 需 要 对 升级 进行 规划 ， 尽 可 能 少 地 对 现 有 用 户 造成 中 断 。 此 外 ， 任 何 与 DBBMS 协 同 工 作 的 其 他 软件 (如 购买 的 应 用 程 
序 、DBA 工 具 和 实用 程序 等 ) 也 都 必须 验证 其 与 新 DBMS 版 本 的 兼容 性 。 总 之 ， 升 级 可 以 说 是 一 种 既 环 手 又 有 难度 的 任务 。 


主 版 本 或 次 版 本 


供应 商 通常 会 在 软件 产品 的 主 版 本 与 次 版 本 之 间作 区 分 。 软 件 的 主 版 本 是 关注 的 重点 ， 有 许多 的 变化 和 新 功能 。 次 版 本 通常 


只 是 轻微 的 改变 ， 变 化 较 少 新 功能 也 不 多 。 


例如 ，Otacle 数 据 库 从 Vetsion 10g 到 Version 11g 是 个 重大 的 变化 〈 版 本 变化 ) 。 而 11g 的 修正 版 Release 2 会 被 认为 是 个 次 版 本 
(只 有 较 小 的 变化 ) 。 通 常 供应 商会 在 发 布 主 版 本 时 提高 价格 ， 而 次 版 本 则 不 一 定 (但 这 也 不 是 一 个 严格 的 规定 ) o 


通常 在 版 本 升级 时 会 添加 重要 的 功能 ， 而 在 中 间 的 修正 版 本 中 则 相对 较 少 。 然 而 ， 从 其 中 的 一 个 修正 版 本 升级 到 另外 的 修正 
版 本 ， 可 能 会 存在 像 主 版 本 升级 时 那么 多 的 潜在 隐患 ， 这 取决 于 每 个 特定 版 本 发 布 的 新 功能 的 特征 。 


在 这 一 章 讨论 的 问题 和 关注 点 涉及 两 种 类 型 的 DBMS 升 级 : 新 的 次 版 本 和 新 的 主 版 本 。 


在 一 个 复杂 的 、 异 构 的 、 分 布 式 的 数据 库 环境 中 ， 连 贯 的 升级 策略 必 不 可 少 。 实 际 上 ， 即 使 企业 只 有 一 个 DBMS， 也 应 该 慎 


重 对 待 DBMSs 升 级 并 制订 相应 的 计划 。 计 划 失 败 会 导致 对 新 功能 的 采用 不 当 且 效率 低下 ， 新 的 以 及 现 有 的 应 用 程序 性 能 下 降 ， 甚 


至 停机 。 

升级 到 新 的 DBMS 版 本 ， 回 报 和 风险 共存 。 以 下 是 升级 到 新 版 本 的 一 些 好 处 : 

: 开发 人 员 可 以 利用 新 版 本 提供 的 新 特征 和 新 功能 。 如 果 开 发 正好 需要 某 个 新 功能 ， 或 可 以 直接 受益 于 某 个 新 功能 ， 那 么 可 
以 相应 地 减少 程序 的 开发 时 间或 者 提高 其 成 本 效益 。 

" 对 于 购买 的 应 用 程序 ， 供 应 商 可 能 需要 DBMS 的 某 个 特定 版 本 或 其 应 用 程序 的 某 个 特定 版 本 的 次 版 本 ， 来 启用 该 应 用 程序 
的 特定 功能 。 

- 新 的 DBMS 版 本 通常 会 提供 增强 的 性 能 和 可 用 功能 ， 用 以 优化 现 有 的 应 用 程序 。 有时， 新 的 DBMS 版 本 需要 扩展 应 用 程 
序 ， 以 支持 更 多 的 用 户 或 更 大 的 数据 量 。 

- DBMS 供 应 商 往 往 对 软件 的 新 版 本 提供 更 好 的 支持 ， 且 响应 问题 的 速度 也 更 快 。 因 为 他 们 不 愿 看 到 新 版 本 和 大 力 推 广 的 版 
本 中 的 错误 造成 的 负面 影响 。 

- 升级 到 新 的 DBMS 版 本 可 能 节约 成 本 。 有 企业 使 用 同一 DBMS 的 多 个 版 本 时 (如 测试 环境 使 用 新 版 本 ， 而 生产 环境 使 用 旧 


版 本 ) ， 供 应 商会 收取 额外 费用 。 如 果 两 个 环境 都 升级 到 同一 版 本 ，DBMS 的 价格 有 时 会 有 所 降低 。 


:一旦 生产 环境 升级 到 新 的 DBMS 版 本 ， 将 会 调整 测试 和 生产 的 数据 库 环境 ， 从 而 使 开发 和 实施 的 环境 一 致 。 如 果 测 试 环境 
运行 新 版 本 的 时 间 过 久 ， 数 据 库 管理 和 应 用 程序 开发 就 会 变 得 更 困难 ， 因 为 测试 数据 库 与 生产 数据 库 将 有 不 同 的 操作 。 


然而 ， 有 效 的 DBMS 升 级 策略 必须 平衡 升级 带 来 的 利益 与 风险 ， 以 得 到 升级 DBMS 新 版 本 或 次 版 本 的 最 佳 时 间 。 升 级 到 新 的 
DBMS 版 本 的 风险 如 下 : 


有 效 的 DBMS 升 级 策略 必须 要 平衡 升级 带 来 的 利益 与 风险 。 

. DBMS 的 升级 通常 会 牵涉 某 种 程度 的 业务 运营 中 断 ， 至 少 ，DBMS 升 级 时 数据 库 是 不 可 用 的 。 如 果 DBMS 升 级 发 生 在 正常 
的 工作 时 间 (或 非 计划 内 停机 时 间 ) ， 可 能 会 导致 停机 和 责 失 商 业 机 会 。 个 人 数据 库 集群 迁移 到 新 DBMS 版 本 的 同时 ， 集 群 数据 
库 实 现 可 能 允许 一 些 数据 库 可 用 。 

. 可 能 会 发 生 其 他 中 断 ， 如 数据 库 结构 转换 或 恢复 那些 先前 支持 而 新 版 本 中 移 除 的 功能 (从 而 导致 应 用 程序 错误 ) 。 也 存在 
应 用 程序 实施 进度 延迟 的 可 能 。 

- 升级 的 成 本 是 DBMS 版 本 迁移 的 重大 障碍 。 首 先 ， 必 须 预 算 新 版 本 或 新 次 版 本 的 成 本 (DBMS 新 版 本 的 加 价 可 能 高 达 
10%~25%) ; 其 次 ， 还 必须 将 升级 成 本 纳入 DBMS 以 及 使 用 数据 库 的 任何 应 用 程序 的 规划 成 本 、 安 装 成 本 、 测 试 成 本 和 部 署 成 
本 ; 最 后 ， 一 定 还 要 包括 为 了 使 用 这 些 新 功能 所 需 的 任何 新 资源 的 成 本 (如 内 存 、 存 储 、 额 外 的 CPU) 。 UI 

- DBMS 供 应 商 经 常 吹 撕 新 版 本 可 以 提升 性 能 。 而 当 SQL 技 术 改 变 时 ，DBMS 的 新 版 本 有 可 能 获取 更 粮 糕 的 SQL 访 问 路 径 。 


DBA 必 须 实 施 严格 的 测试 过 程 以 确保 该 访问 路 径 对 应 用 程序 性 能 是 有 帮助 的 、 无 害 的 。 性 能 受到 影响 时 ， 可 能 需要 改变 应 用 程 
序 的 代码 ， 这 是 一 项 非常 昂贵 又 耗 时 的 工作 。 严 格 的 测试 过 程 应 该 可 以 获取 测试 环境 中 的 大 部 分 访问 路 径 更 改 。 


- 新 的 DBMS 版 本 可 能 会 废弃 现 有 应 用 程序 正在 使 用 的 一 些 功能 和 语法 门 。 如 果 这 种 情况 发 生 ， 必 须 在 升级 前 对 应 用 程序 进 


行 修 改 。 


:为 了 利用 新 的 DBMS 版 本 的 一 些 改进 ，DBA 可 能 要 应 用 一 些 侵入 性 的 改变 。 例 如 ， 如 果 新 版 本 增加 了 一 个 数据 库 对 象 的 最 
大 值 ，DBA 可 能 必须 删除 并 重建 此 对 象 以 利用 该 最 大 值 。 这 将 在 DBMS 内 部 控制 架构 增加 的 情况 下 ， 促 进 这 种 变化 。 


- 配套 软件 产品 可 能 缺乏 对 新 的 DBMS 版 本 的 即时 支持 。 配 套 软 件 包括 操作 系统 、 事 务 处 理 器 、 消 息 队 列 、 购 买 的 应 用 程 
序 、DBA 工 具 、 开 发 工具 以 及 查询 和 报告 软件 。 


在 对 升级 到 一 个 新 的 DBMSs 版 本 的 利弊 进行 权衡 之 后 ，DBA 团 队 必须 创建 一 个 适用 于 该 企业 的 升级 计划 。 有 时 出 了 新 版 本 后 
立即 进行 升级 ， 但 往往 会 滞后 一 段 时 间 ， 大 约 为 新 版 本 发 布 后 广泛 采用 前 的 这 么 一 段 时 间 。 


如 果 一 个 新 版 本 的 风险 大 于 利益 ， 在 不 影响 未 来 升级 的 情况 下 ， 一 些 企业 可 能 选择 跳 过 临时 的 升级 。 例 如 ， 大 量 的 Oracle 
用 户 选择 直接 从 Oracle 7 升级 到 Oracle 8i， 而 跳 过 了 Oracle 8。 如 果 DBMS 供 应 商 不 允许 用 户 绕 过 某 个 版 本 或 次 版 本 ， 那 么 就 等 
到 下 一 个 版 本 发 布 之 后 再 进行 部 署 。 例 如 ， 考 虑 以 下 一 些 情况 : 


1.ABC 公 司 在 使 用 DBCorp 的 数据 库 DB 第 8 版 。 

2.DBCorp 宣 布 发 布 DB 第 9 版 。 

3.ABC 公 司 分 析 了 该 版 本 的 功能 和 风险 后 决定 暂 不 升级 。 

4.DBCorp 稍 后 又 发 布 了 DB 第 10 版 ， 但 没有 提供 从 第 8 版 到 第 10 版 的 直接 升级 路 径 。 

5.ABC 公 司 觉得 第 10 版 提供 了 许多 有 用 的 功能 ,决定 马 上 升级 。 然 而 却 没有 理由 来 部 署 使 用 第 9 版 。 
6. 为 了 满足 需求 ，ABC 公 司 首先 升级 到 第 9 版 ， 随 后 立即 升级 到 第 10 版 。 


尽管 升级 多 个 版 本 需要 更 多 的 时 间 ， 但 这 么 做 允许 用 户 有 效 地 控制 何 时 以 及 如 何 升级 到 新 的 DBMS 版 本 ， 而 不 至 于 受 DBMS 
供应 商 的 牵制 。 尝 试 多 个 版 本 的 升级 时 ， 一 定 要 充分 了 解 每 个 临时 版 本 新 增 的 功能 和 特性 。 如 果 遇 到 以 上 假设 的 ABC 公 司 的 情况 
时 ，DBA 就 需要 研究 并 准备 那些 新 功能 了 ， 不 仅 第 10 版 ， 还 包括 第 9 版 的 。 


多 个 版 本 的 升级 允许 用 户 有 效 地 控制 何 时 以 及 如 何 升级 到 新 的 DBMS 版 本 。 
适当 的 DBM 升级 策略 取决 于 多 种 因素 。 以 下 章节 概括 了 有 效 的 DBM 升级 策略 必须 考虑 的 所 有 问题 。 


[1] 还 需要 仔细 检查 任何 新 的 DBMS 主 版 本 或 次 版 本 的 说 明 书 ， 有 时 DBMS 的 一 些 特 征 或 功能 会 删除 ， 这 可 能 导致 需要 额外 的 费用 
来 为 这 些 移 除 的 功能 埋单 。 例 如 ，IBM DB2 在 第 6 版 与 第 7 版 之 间 删 除了 原来 的 免费 数据 库 实用 程序 ， 并 将 它们 捆绑 销售 。 
[2] 一 个 功能 弃 用 时 ， 软 件 将 不 再 支持 它 。 


2.3.1 产品 特性 与 复杂 性 
或 许 能 够 决定 何 时 以 及 如 何 升级 到 新 的 DBM 版 本 的 最 大 因素 是 新 版 本 所 支持 的 功能 。 与 功能 紧密 耦合 是 涉及 新 功能 支持 与 
管理 的 固有 的 复杂 性 。 


如 果 应 用 程序 开发 人 员 都 呼吁 DBMS 新 功能 时 ， 延 缓 升 级 会 比较 困难 。 如 果 DBMS 的 功能 可 以 最 大 限度 地 减少 开发 成 本 和 精 
力 ，DBA 团 队 会 感受 到 即刻 升级 到 新 版 本 的 压力 。 另 外 一 个 将 迫使 采用 新 版 本 的 因素 是 新 版 本 解决 了 DBMS 和 存在 的 一 些 问题 (而 
不 是 通过 定期 维护 修复 的 ) 。 


尽管 新 版 本 的 呼声 很 高 ， 某 些 管理 和 部 署 的 细节 问题 也 必须 在 升级 前 解决 。DBA 团 队 必 须 保证 : 修改 标准 以 包括 这 些 新 功 
能 ， 指 导 开发 人 员 和 用 户 这 些 新 功能 如 何 工作 以 及 如 何 使 用 ， 并 准备 好 支持 这 些 新 功能 的 基础 设施 。 


为 支持 新 功能 所 需 的 改变 类 型 必须 考虑 到 升级 策略 中 。 当 DBMS 供 应 商 对 内 部 结构 、 数 据 的 页 面 布局 或 地 址 空间 做 出 改变 


时 ， 升 级 的 风险 更 大 。 这 种 情况 下 ， 额 外 的 测试 是 必需 的 ， 用 来 确保 数据 库 实 用 程序 、DBA 工 具 以 及 数据 提取 和 移动 工具 在 修 
改 后 的 内 部 结构 中 仍然 可 以 使 用 。 


2.3.2 ”DBMS 环 境 的 复杂 性 


数据 库 环 境 越 复杂 ， 升 级 到 新 的 DBMS 版 本 就 越 困 难 。 第 一 个 复杂 性 问题 是 环境 的 大 小 。 数 据 库 服 务 器 、 实 例 、 应 用 程序 、 
用 户 的 数量 越 大 ， 升 级 就 越 复 杂 ; 其 他 的 问题 包括 DBMS 所 支持 的 应 用 程序 的 类 型 。 在 只 有 简单 的 、 批 处 理应 用 程序 时 ，DBMS 
的 升级 更 容易 实现 ， 因 为 随 着 应 用 程序 复杂 性 和 可 用 性 需求 的 增加 ， 升 级 的 难度 也 随 之 增 大 。 


数据 库 服务 器 的 位 置 也 影响 版 本 升级 策略 。 数 据 库 服 务 器 一 般 支 持 不 同 的 业务 且 处 于 不 同 的 位 置 ， 因 此 ， 有 效 地 规划 和 部 署 
跨 服务 器 的 DBMS 升 级 非常 困难 。 升 级 策略 可 能 涉及 支持 多 个 DBMS 版 本 ， 它 们 处 于 不 同 的 位 置 且 又 为 不 同 的 应 用 程序 服务 。 在 
生产 环境 中 应 避免 使 用 不 同 的 版 本 ， 但 也 不 是 绝对 的 。 


最 后 ， 还 必须 考虑 访问 数据 库 的 应 用 程序 的 复杂 性 。 应 用 程序 越 复 杂 ， 就 越 难保 证 在 修改 DBMS 的 同时 ， 它 们 还 能 持续 不 断 
地 起 作用 。 复 杂 性 问题 包括 以 下 几 种 : 


+ 存储 过 程 和 自 定 义 函 数 的 用 法 。 


.SQL 的 复杂 性 一 -SQL 中 包含 的 表 越 多 ，SQL 的 特性 越 复 杂 ， 就 越 难 保证 改变 访问 路 径 时 不 影响 性 能 。 


- C/S 处 理 网 络 和 多 层 的 应 用 使 得 测试 新 的 DBMS 版 本 变 得 复杂 。 


设计、 编码 和 由 框架 或 IDE (如 Hibernate) 所 产生 的 应 用 程序 中 可 能 有 额外 的 组 件 需要 使 用 新 的 DBMS 版 本 进行 测试 。 


与 其 他 基础 设施 软件 的 集成 ， 如 消息 队列 和 事务 处 理 器 ， 可 以 使 升级 变 得 复杂 ， 因 为 这 些 软件 的 新 版 本 可 能 也 要 支持 新 的 
DBMS 版 本 。 


+ 程序 所 使 用 的 语言 可 能 也 影响 DBMS 的 升级 ， 因 为 这 些 语言 对 编译 器 版 本 、API (应 用 程序 接口 ) 的 改变 或 5QL 府 入 应 用 
程序 的 方式 的 支持 有 所 不 同 。 


2.3.3 ”DBMS 供 应 商 的 声誉 


DBMS 供 应 商 在 技术 支持 、 修 复 错误 和 回应 问题 方面 有 各 自 的 声誉 ， 因 此 ， 在 选择 数据 库 时 客户 的 参考 很 重要 ，。 
供应 商 的 声誉 越 高 ， 企 业 迅 速 采 用 该 供应 商 的 新 版 本 的 可 能 性 就 越 大 。 


供应 商 的 声誉 越 高 ， 企 业 迅 速 采用 该 供应 商 的 新 版 本 的 可 能 性 就 越 大 。 如 果 DBMS 供 应 商 在 用 户 升级 新 版 本 时 ， 善 于 快速 地 
响应 他 们 的 问题 并 提供 支持 ， 那 么 这 些 用 户 也 势必 更 积极 地 参与 到 升级 活动 中 。 


2.3.4 DBMS 的 支持 条 款 


当 推 出 新 版 本 时 ，DBMS 供 应 商 将 会 淘汰 老 版 本 且 不 再 提供 支持 。 因 此 ，DBMS 供 应 商 支 持 老 版 本 的 时 长 必须 考虑 到 DBMS 


版 本 升级 策略 中 。 绝 对 不 应 在 生产 环境 中 使 用 供应 商 不 再 提供 支持 的 DBM 版 本 ， 否 则 一 旦 出 现 问题 ， 他 们 将 无 法 为 你 解决 。 


有 时 ， 以 特殊 的 方式 上 且 增 加 维护 费用 的 情况 下 ，DBMS 供 应 商会 为 某 个 退役 的 版 本 提供 支持 。 如 果 绝对 必须 继续 使 用 已 经 退 
役 的 DBMs 版 本 (因为 业务 或 应 用 程序 ) ， 一 定 要 事先 调查 供应 商 有 天 软件 的 退役 版 本 的 支持 条 款 。 


2.3.5 企业 风格 


每 个 企业 在 采用 新 的 产品 和 技术 时 ， 都 会 显示 出 一 些 能 够 揭露 其 风格 的 特点 。Gartner 公 司 的 行业 分 析 师 已 经 将 企业 进行 排 
名 ， 且 将 它们 划分 成 三 个 不 同 的 群体 ， 标 记 类 型 分 别 为 A、 B、C。A 类 型 的 企业 是 技术 驱动 的 ， 本 身 更 愿意 冒险 尝试 新 的 和 未 经 
验证 的 技术 以 求 获取 竞争 优势 。B 类 型 的 企业 ， 一 旦 有 人 发 现 了 新 技术 的 错误 ， 它 们 将 不 太 愿意 冒险 采用 。 最 后 ，C 类 型 的 企业 
非常 注重 成 本 和 规避 风险 ， 遇 到 | 新 技术 时 常 居于 人 后 。 


一 旦 新 的 DBMS 版 本 发 布 且 能 为 企业 带 来 优势 ， 只 有 A 类 型 的 企业 会 计划 即刻 进行 升级 。C 类 型 的 企业 应 该 会 采用 非常 保守 
的 策略 ， 确 保 新 版 本 稳定 且 已 通过 A 类 型 的 企业 和 B 类 型 的 企业 的 测试 。B 类 型 的 企业 会 介 于 A 和 C 之 间 : 几乎 从 来 不 会 立即 升 
级 ， 也 不 会 在 最 早 的 用 户 发 现 了 大 问题 之 后 ， 但 会 在 C 类 型 企业 之 前 升级 。 


2.3.6 ”DBA 人员 技能 组 合 


如 果 DBA 人 员 的 技能 娴熟 或 者 经 验 丰 富 ， 那 么 升级 DBMS 也 会 非常 简单 。DBA 人 员 的 技能 水 平 降低 ， 升 级 的 风险 将 随 之 增 
加 。 如 果 你 所 在 企业 的 DBA 技 能 不 够 娴熟 ， 或 从 来 没有 做 过 DBMS 版 本 升级 ， 赶 紧 增加 DBA 人 员 吧 ,一定 要 有 升级 顾问 。 打 造 
一 个 完整 的 内 部 PDBA 和 顾问 团队 ， 将 尽 可 能 确保 升级 过 程 顺 利 。 此 外 ，DBA 人 员 也 要 做 好 准备 在 未 来 的 升级 中 能 够 独当一面 。 


DBA 人 员 的 技能 水 平 降低 ， 升 级 的 风险 将 随 之 增加 。 


如 果 需 要 顾问 ，DBMS 版 本 升级 预算 中 一 定 要 包括 他 们 的 佣金 成 本 。 预 算 应 保证 顾问 一 直 保 留 到 所 有 的 生产 数据 库 环境 都 稳 


oo 
人 A。 


2.3.7 平台 支持 


DBMS 供 应 商 发 布 其 产品 的 一 个 新 版 本 时 ， 并 不 立即 支持 所 有 的 平台 和 操作 系统 。 通 常 最 先 支持 的 平台 和 操作 系统 具有 最 多 
的 特许 用 户 。 新 版 本 对 平台 的 支持 顺序 也 可 能 因 供应 商 的 不 同 而 不 同 。 例 如 ，System z 与 Linux 的 组 合 对 IBM 比 Oracle 更 具 战 略 
BM, Alt, IBM DB2 的 新 版 本 将 最 有 可 能 很 快 地 支持 System z 与 Linux 组 合 ， 而 这 在 Oracle 中 可 能 就 是 另外 的 情况 了 。 这 个 问 
题 在 UNIX 平 台 就 很 环 手 了 ， 因 为 市 面 上 UNIX 的 变种 实在 太 多 。 最 流行 的 变种 是 Oracle Solaris, IBM AIX, HP HP-UX 以 及 
Linux (UNIX 的 开源 版 本 ，Red Hat 和 Suse 比 其 他 版 本 更 频繁 ， 发 展 更 迅速 ) 。 新 版 本 一 发 布 ， 大 多 数 DBM S 供 应 商 将 快速 支持 
这 些 UNIX 平 台 ， 而 对 于 其 他 不 太 受 欢迎 的 UNIX 平 台 ， 则 需要 更 长 时 间 才 可 能 得 到 供应 商 的 支持 。 


规划 DBMS 升 级 时 ,一定 要 考虑 所 使 用 的 DBMS 平 台 ， 并 尝试 衡量 该 平台 对 于 其 供应 商 的 优先 级 。 升 级 策略 中 务必 预 留 一 些 
小 后 时 间 ， 以 满足 供应 商 对 这 一 特殊 平台 的 交付 时 间 表 。 


2.3.8 ”配套 软件 


慎重 考虑 DBMS 升 级 对 任何 配套 软件 的 影响 。 配 套 软 件 包括 购买 的 应 用 程序 、DBA 工 具 、 报 告 和 分 析 工 具 、 查 询 工具 。 每 种 
软件 的 供应 商 支 持 和 开发 利用 新 的 DBMS 版 本 的 时 间 段 都 会 有 所 不 同 。 请 查看 “支持 与 利用 ”理解 支持 和 开发 利用 新 的 DBMS 版 
本 的 区 别 。 


慎重 考虑 DBMS 升 级 对 任何 配套 软件 的 影响 。 


一 般 来 说 ， 第 三 方 工具 的 供应 商都 会 遵守 新 DBMS 版 本 的 支持 与 利用 规则 。 但 只 要 可 能 ,还 是 要 求 供 应 商 说 明 他 们 的 DBMS 
升级 支持 政策 。 因 为 他 们 可 能 不 会 承诺 支持 新 版 本 的 任何 日 期 或 日 期 范围 ， 有 些 DBMS 版 本 比较 庞大 并 且 比 较 复杂 ， 因 此 充分 开 
发 利用 需要 较 长 的 时 间 。 


支持 与 利用 


一 些 供应 商 对 支持 与 利用 新 的 DBMS 版 本 (或 次 版 本 ) 有 明确 的 区 分 。 软 件 支持 新 版 本 ， 即 软件 将 继续 像 DBMS 升 级 前 一 样 
运作 ， 但 没有 新 的 功能 。 因 此 ， 如 果 一 款 DBA 工 具 支持 Oracle 的 新 版 本 ， 只 要 没有 使 用 其 中 的 新 功能 ， 该 工具 就 可 以 提供 以 往 版 
本 中 的 所 有 服务 。 相 比 之 下 ，DBA 工 具 开发 利用 新 版 本 则 会 提供 一 些 对 该 版 本 的 新 功能 进行 操作 的 必 备 功能 。 


因此 ， 一 个 具体 的 例子 是 : IBM 在 DB2 的 第 10 版 增加 了 对 散 列 的 支持 ，DBA 工 具 不 操作 散 列 也 可 以 支持 DB2 的 第 10 版 ,但 是 
开发 利用 DB2 的 第 10 版 必须 要 对 散 列 进行 操作 。 


升级 到 新 的 DBMS 版 本 之 前 ， 一 定 要 理解 支持 新 版 本 与 利用 新 版 本 之 间 的 区 别 ， 并 从 在 用 的 DBA 工 具 的 第 三 方 供应 商 那 里 获 
得 二 者 的 时 间 表 。 


2.3.9 ERRI 
任何 新 的 DBMSs 版 本 都 应 有 一 本 手册 ， 概 括 阅 明 新 版 本 的 功能 ， 并 介绍 回 滚 到 前 一 版 本 的 过 程 。 一 定 要 检查 发 布 指 南 中 


DBMS 供 应 商 提供 的 回 滚 过 程 ， 如 果 升 级 出 现 错误 或 性 能 问题 接 路 而 至 ， 升 级 过 程 或 升级 之 后 出 现 其 他 问题 ， 你 可 能 需要 返回 到 
以 前 的 版 本 。 但 是 ， 回 滚 并 不 适用 于 每 个 新 的 DBMS 版 本 。 


如 果 需 要 回 滚 ， 可 以 遵循 DBMSsS 供 应 商 推 荐 的 过 程 。 因 为 回 滚 可 能 需要 推迟 某 些 新 功能 的 部 署 。 充 分 了 解 DBMS 供 应 商 强 加 
于 回 滚 的 局 限 性 ， 只 有 当 你 的 企业 不 再 需要 进行 回 滚 时 才 可 以 开发 利用 新 的 功能 。 


2.3.10 ”迁移 验证 


DBA 应 实现 一 些 程序 (类 似 于 安装 程序 ) 去 验证 DBMS 版 本 升级 是 否 令 人 满意 。 不 仅 要 执行 安装 DBMS 同 样 的 步骤 ， 还 要 对 


DBA 应 实现 一 些 程序 来 验证 DBMS 版 本 升级 是 否 令 人 满意 。 


2.3.11 DBMS 升 级 策略 


一 般 情况 下 ， 可 以 根据 前 面 章节 所 讨论 的 指导 方针 来 设计 DBMS 版 本 升级 策略 。 每 个 特定 的 DBMS 升 级 都 是 独一无二 的 ,但 
前 面 讨论 的 策略 将 更 容易 帮助 你 取得 成 功 。 一 个 经 过 深思 熟 虑 的 DBMS 升 级 策略 可 以 将 新 版 本 对 企业 的 影响 降 到 最 低 ， 且 使 得 新 
版 本 的 风格 最 适合 你 的 企业 。 


24 ”数据库 标准 与 过 程 


想 要 有 效 地 使 用 新 安装 的 DBMS， 必 须 开发 使 用 数据 库 的 标准 和 过 程 。 研 究 表明 ， 相 比 标准 化 较 低 的 公司 ， 那 些 高 标准 化 的 
公司 可 以 将 用 于 支持 终端 用 户 的 成 本 降低 35% 甚 至 更 多 。 


必须 开发 使 用 数据 库 的 标准 和 过 程 。 


标准 是 用 于 确保 数据 库 环 境 的 一 致 性 和 有 效 性 的 常见 做 法 ， 如 数据 库 命名 约定 。 程 序 是 定义 好 的 、 步 进 式 的 指示 ， 用 于 指导 
处 理 具 体 事 件 的 事务 ， 如 灾难 恢复 计划 。 未 能 实现 数据 库 标 准 和 过 程 会 使 数据 库 环境 变 得 混乱 且 难 以 管理 。 


DBA 应 当 开 发 数据 库 标 准 和 过 程 ， 以 此 作为 企业 范围 内 IT 标准 和 过 程 的 组 成 部 分 。 它 们 要 么 以 纸 质 文件 的 形式 集中 人 存放， 要 
么 以 电子 格式 存储 于 网 上 ， 或 者 两 种 形式 都 有 。 针 对 特定 的 DBM 产品 ， 一 些 供应 商 还 提供 了 “ 饶 装 的 ”标准 和 过 程 。 


24.1 数据 库 命 名 约定 


即将 部 署 的 首要 标准 之 一 是 一 组 数据 库 对 象 命名 的 指南 。 没 有 标准 的 数据 库 对 象 命名 约定 ， 就 难以 正确 识别 数据 库 对 象 ， 并 
进行 适当 的 管理 任务 。 


数据 库 对 象 命名 标准 的 制订 应 结合 企业 的 所 有 其 他 IT 命名 标准 。 在 所 有 情况 下 ， 数 据 库 命名 标准 的 制订 应 与 数据 管理 部 门 
(ORE) 合作 ， 并 且 ， 只 要 可 能 ， 它 应 与 其 他 的 上 T 标 准 和 平 共 存 ， 但 不 能 以 危害 数据 库 环 境 为 代价 。 许 多 企业 有 命名 文件 的 
实践 约定 ， 但 协调 数据 库 对 象 可 能 需要 特定 格式 的 数据 库 文件 名 ， 却 与 实践 标准 不 符 ( 详 见 图 2-7) 。 因 此 ， 命 名 数据 库 文 件 对 
于 现 有 的 实践 标准 来 说 是 个 例外 。 


数据 集 或 文件 系统 目录 


操作 系统 文件 系统 


图 2-7 数据 库 对 象 文 件 名 的 映射 


确保 创建 并 发 布 适用 于 所 有 数据 库 对 象 (在 企业 所 使 用 的 每 个 DBM S 内 都 可 以 创建 ) 的 命名 标准 。 多 数 DBMS 支 持 的 数据 库 
对 象 的 一 个 基本 列表 包括 数据 库 、 表 、 列 、 视 图 、 索 引 、 约 束 、 程 序 、 用 户 自 定义 数据 类 型 、 用 户 自 定义 函数 、 触 发 器 和 人 存储 过 
程 。 然 而 ， 这 个 列表 还 不 完整 ， 因 为 每 个 DBMS 针 对 具体 的 操作 还 会 使 用 其 他 的 数据 库 对 象 。 例 如 ，DB2 使 用 计划 和 存储 组 ; 
Oracle 使 用 数据 库 链 接 和 集群 ，SQL Server 使 用 文件 组 和 规则 ( 详 见 “ 非 标 准 数据 库 对 象 实例 ”) 。 


确保 创建 适用 于 所 有 数据 库 对 象 的 命名 约定 。 


数据 库 命名 标准 的 设计 应 尽量 减少 跨 环境 的 名 称 变更 。 例 如 ,将 “T” 嵌 入 名 称 “test” 和 将 “P” 许 入 “production” 都 
是 不 明智 的 。 尤 其 重要 的 是 对 用 户 可 见 的 数据 库 对 象 如 列 、 表 、 视 图 更 要 避免 使 用 此 种 做 法 。 名 称 变 更 最 小 化 使 数据 库 从 一 个 环 
境 到 另 一 个 环境 的 迁移 变 得 简单 。 有 种 情况 也 是 可 能 的 ， 即 所 有 的 数据 库 对 象 具有 相同 的 名 称 ， 只 是 将 每 个 环境 分 配 到 不 同 的 实 
例 或 子 系统 。 该 实例 或 子 系统 的 名 称 (而 不 是 数据 库 对 象 的 名 称 ) 将 用 于 区 分 环境 。 


减少 跨 环 境 的 名 称 变更 。 
非 标准 数据 库 对 象 实例 


除非 你 使 用 所 有 三 种 数据 库 : DB2、Oracle 和 SQL Servet， 否 则 你 可 能 对 那些 针对 某 一 种 数据 库 系 统 的 数据 库 对 象 不 熟悉 。 
鉴于 此 ， 这 里 给 本 章 提 到 的 数据 库 对 象 进行 了 简单 的 定义 。 


DB2: 
- 计划 与 DB2 的 应 用 程序 相关 ， 是 指 在 该 程序 中 包含 SQL 的 绑 定 访问 路 径 详细 信息 的 数据 包 。 
* 存储 组 是 一 个 数据 库 对 象 ， 用 于 关联 磁盘 存储 和 DB2 表 空间 。 

Oracle: 
+ 数据 库 链 接 是 一 个 数据 库 中 的 模式 对 象 ， 使 你 可 以 访问 另 一 个 数据 库 中 的 对 象 。 


` 集群 由 一 组 共享 相同 的 数据 块 的 表 组 成 。 这 些 表 组 合 在 一 起 因为 它们 有 着 共同 的 列 ， 且 它们 常 一 起 使 用 。 


SQL Server: 
AFP AAS EL, BAT Bho LH AAE KA PE HK. 
- 规则 是 一 种 独立 的 、 可 以 附加 到 列 的 数据 库 约 束 。Mictosoft 公 司 已 经 表示 ， 在 未 来 的 SQL Setrvet 版 本 中 将 会 删除 规则 。 


在 大 多 数 情 况 下 ， 对 于 那些 没有 被 典型 终端 用 户 访问 的 对 象 ， 可 以 提供 一 种 方法 来 区 分 数据 库 对 象 的 类 型 。 例 如 ， 索 引 
以 "I" By "X" 开头 ， 而 数据 库 以 “D” 开 头 。 但 是 ， 正 如 前 面 所 提 到 的 ， 这 种 做 法 对 于 表 和 类 似 的 对 象 是 不 合适 的 。 


一 般 情 况 下 ， 不 要 对 终端 用 户 访问 的 对 象 名 称 施加 不 必要 的 限制 。 关 系数 据 库 讲 究 的 是 用 户 友好 。 一 个 严格 的 数据 库 命 名 约 
E (如 果 制 定 的 不 合乎 逻辑 ) 可 能 与 有 用 且 有 效 的 数据 库 环境 背道而驰 。 一 些 企业 对 数据 库 表 的 长 度 任意 限制 ， 比 如 ， 限 制 为 8 
字 节 ， 而 DBMS 可 以 支持 多 达 128 字 节 的 表 名 。 对 数据 库 表 名 的 长 度 施 加 限制 没有 任何 实际 的 原因 。 


在 合理 的 范围 内 ， 表 名 应 尽 可 能 具有 描述 性 。 此 外 ， 只 要 DBMS 支 持 所 有 DBMS 支 持 的 “类 表 ”″” 对 象 都 应 使 用 相同 的 命名 约 
定 ， 如 视图 、 同 义 词 、 别 名 。 每 个 对 象 基本 上 都 与 行 和 列 一 样 ， 是 可 存 取 的 数据 集 。 因 此 ， 对 每 个 对 象 制定 单独 的 命名 约定 没 
什么 实际 价值 。 使 用 这 种 方法 ， 那 些 操作 与 表 类 似 的 数据 库 对 象 ， 将 同样 具有 描述 性 的 名 称 。 对 象 的 类 型 通常 可 以 通过 查询 
DBMS 的 系统 目录 或 数据 字典 确定 。 


避免 对 表 名 进行 编码 使 其 变 短 。 


另外 一 种 应 避免 的 任意 命名 约定 是 对 表 名 进行 编码 使 其 变 短 。 表 的 名 称 应 包括 2~ 3 字 节 的 应 用 识别 前 缀 ， 后 跟 一 个 下 划 线 ， 
然后 是 一 个 明确 的 、 对 用 户 友 好 的 名 字 。 例 如 ， 人 力 资源 系统 中 ， 一 个 好 的 表 名 需要 包含 雇员 的 信息 HR_EMPLOYEE。 有 多 个 
应 用 程序 用 到 该 表 时 ， 也 不 应 将 应 用 识别 前 缀 从 表 的 名 称 中 删除 。 


还 需要 注意 的 是 ， 有 些 数 据 库 对 象 的 名 称 在 某 些 情况 下 将 会 外 部 化 。 例 如 ， 一 旦 约束 被 违反 ， 大 多 数 的 DBM 9 都 会 选择 将 约 
束 名 称 外 部 化 。 约 束 的 类 型 多 种 多 样 (触发 器 、 唯 一 约束 、 参 照 约束 、 检 查 约 束 ) ， 每 一 种 都 可 以 命名 。 跨 环境 保持 名 称 一 致 可 
以 使 得 错误 信息 也 一 致 ， 如 果 DBMS 在 开发 、 测 试 、 集 成 、 生 产 环境 中 都 报 了 同样 的 错误 信息 ， 那 么 调试 和 修正 错误 就 比较 容 


易 。 


标准 缩写 


尽管 应 尽 可 能 使 数据 库 对 象 的 名 称 为 英语 ， 但 是 也 不 可 避免 地 会 遇 到 需要 使 用 缩写 的 情况 。 只 有 当 完 整 的 名 称 太 长 ， 对 象 名 
称 看 起 来 很 笨拙 或 比较 难 记 时 ， 才 可 以 使 用 缩写 。 例 如 ， 如 果 “ORG ”是 “organization” 的 标准 缩写 ， 就 不 要 使 用 变 
体 “ORGZ”。 使 用 标准 的 缩写 将 最 大 程度 地 减少 拼写 错误 ， 并 且 使 用 户 更 容易 记 住 数据 库 对 象 的 名 称 。 长 期 于 此 ， 可 以 使 数据 
库 的 对 象 更 容易 理解 。 


建立 标准 缩写 列表 。 


2.4.2 ”其 他 数据 库 标 准 和 过 程 


数据 库 命名 标准 虽然 重要 ， 也 需要 制定 和 维护 其 他 类 型 的 数据 库 标 准 。 要 为 企业 所 使 用 的 每 个 DBMS 都 制定 一 套 综合 的 标准 
和 过 程 。 数 据 库 标 准 虽 然 可 以 从 头 做 起 ， 但 还 有 其 他 潜在 的 、 更 简单 的 方法 来 构建 标准 库 。 那 些 可 以 根据 用 户 需 求 进行 修改 的 基 
本 标准 ， 可 以 从 出 版 商 或 软件 供应 商 那里 购买 ， 或 者 可 以 通过 用 户 组 和 会 议 ， 在 社区 收集 大 家 所 建议 的 标准 。 


这 些 标准 无 论 是 购买 的 、 自 己 想 出 来 的 ， 还 是 从 用 户 组 或 委员 会 得 到 的 ， 都 应 涵盖 以 下 几 个 方面 。 


角色 和 职责 


DBMSs 的 成 功 运行 需要 多 名 熟练 的 技术 人 员 和 业务 专家 的 共同 协调 管理 工作 。 应 该 制定 出 数据 库 管 理 及 管理 职能 的 和 矩阵 文 
件 ， 详 细 列 出 每 一 种 支持 任务 以 及 分 别 由 谁 来 提供 支持 。 德 阵 文件 可 以 是 部 门 级 别 的 、 工 作 描述 级 别 的 ， 甚 至 是 个 人 名 义 的 。 表 
2-4 给 出 了 实例 矩阵 ， 其 中 “X” 表示 参与 这 一 过 程 ， 而 “P” 表 示 主 要 的 职责 


表 2-4 ”数据库 支持 的 角色 与 职责 
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当然 ， 你 可 以 创建 任何 任务 ， 只 要 你 认为 它 有 必要 出 现在 角色 与 职责 和 矩阵 中 。 你 所 需 的 任务 可 能 比 示例 中 的 多 ， 也 可 能 少 。 
例如 ， 你 可 能 希望 将 存储 过 程 的 开发 、 测 试 、 管 理 进行 区 分 ， 所 以 分 别 为 这 三 者 创建 不 同 的 任务 种 类 ， 并 相应 地 将 支持 需求 进行 
分 解 。 


不 管 角色 与 职责 矩阵 的 最 终 格式 如 何 ， 一 定 要 保证 它 的 准确 性 并 包含 最 新 的 DBMS 功 能 和 任务 。 最 新 的 矩阵 可 以 更 容易 地 定 
义 企业 内 的 角色 ， 并 能 有 效 地 分 配 数据 库 相 关 的 工作 量 。 


沟通 标准 


你 也 可 以 选择 为 团队 或 具体 人 员 之 间 制 定 具体 的 标准 。 例 如 ， 在 新 的 DBMS 版 本 安装 过 程 中 ， 你 可 能 想 记 录 DBA 团 队 如 何以 
及 何 时 与 系统 编程 团队 沟通 。 


制定 强大 的 沟通 标准 可 以 简化 DBA 在 不 可 避免 的 停机 时 间 的 工作 ， 停 机 由 于 系统 、 应 用 程序 ， 甚 至 硬件 错误 而 导致 。 例 
如 ， 考 虑 采用 一 种 标准 ， 在 故障 排除 和 紧急 修复 过 程 中 DBA 可 仅 与 经 理 沟通 。 既 让 经 理 知晓 ， 同 时 也 让 DBA 可 以 避 开 愤怒 的 用 
户 、 帮 助 服务 台 等 的 电话 骚扰 。 经 理 可 以 随时 给 外 部 通报 状态 ， 而 DBA 可 以 专注 于 故障 排除 并 使 系统 恢复 正常 运作 。 


数据 管理 标准 


如 果 你 的 企业 有 DA 团队 ， 他 们 应 制定 出 一 套 基本 的 数据 管理 标准 指南 来 概述 他 们 的 工作 职责 范围 。 如 果 没 有 DA 团队 ， 则 一 
定 要 在 DBA 标 准 中 适当 地 包含 DA 标准 。 


在 DBA 标 准 中 适当 地 包含 DA 标准 。 

数据 管理 标准 应 包含 以 下 几 项 : 

- 清晰 地 描述 企业 整体 的 数据 策略 ， 包 括 其 对 企业 的 重要 性 。 
. 建立 数据 所 有 权 和 管理 权 的 准则 。 

- 数据 创建 、 数 据 所 有 权 和 数据 管理 权 的 规则 。 

.元 数据 管理 政策 。 

+ 概念 和 逻辑 数据 建 模 指 南 。 

有 关 创 建 企业 数据 模型 的 企业 目标 。 

- 创建 并 维护 逻辑 数据 模型 的 职责 。 

- 工具 使 用 指南 以 及 数据 模型 创建 、 存 储 、 维 护 的 说 明 。 
: 企业 的 数据 共享 政策 。 

+ 物理 数据 库 偏离 丈 辑 数据 库 时 的 记录 说 明 。 


“ 数据 管理 与 数据 库 管理 的 沟通 指南 ， 以 确保 数据 库 的 有 效 创建 与 使 用 。 


数据 库 管理 标准 


应 建立 一 套 基本 的 数据 库 管理 标准 用 以 确保 DBA 的 工作 可 以 不 断 获得 成 功 。 该 标准 要 作为 DBA 提 供 服 务 和 用 于 支持 数据 库 
环境 的 具体 方法 的 指导 。 例 如 ， 制 定 的 标准 可 以 概述 说 明 创 建 一 个 新 的 数据 库 或 更 改 已 有 的 数据 库 需 要 如 何 提出 申请 ， 并 指定 哪 
些 类 型 的 数据 库 对 象 科 DBMS 功 能 更 受 青睐 ,以 及 在 何 种 情况 下 要 避免 使 用 它们 。 标 准 还 可 以 建立 备份 和 恢复 程序 (包括 灾难 恢 
复 计划 ) 并 交流 用 于 将 逻辑 数据 模型 转换 为 物理 数据 库 的 方法 。 另 外 一 套 涵盖 数据 库 性 能 监控 和 调 优 的 DBA 标 准 可 能 对 记录 解 
决 性 能 问题 的 过 程 很 有 用 。 


DBA 标 准 要 作为 支持 数据 库 环境 具体 方法 的 指导 。 


虽然 该 DBA 标 准 对 DBA 人 员 将 是 最 有 用 的 ， 但 是 应 用 程序 开发 人 员 也 需要 通过 它们 学 习 如 何 更 好 地 与 DBBA 人 员 一 起 工作 。 
此 外 ，DBA 标 准 所 记录 的 任何 性 能 调 优 的 技巧 都 应 与 编程 人 员 共享 。 了 解 DBMS 细 微 差 别 和 DBA 角 色 的 应 用 程序 编程 人 员 越 
多 ，DBA 与 开发 人 员 之 间 的 工作 关系 将 更 融洽 (最 终 导 致 数据 库 环 境 更 高 效 ) 。 


系统 管理 标准 


再 次 说 明 ， 只 有 当 你 的 企业 将 SA 与 DBA 的 工作 分 离 时 ， 才 需要 系统 管理 标准 或 系统 编程 标准 。 需 要 系统 管理 标准 与 需要 
DBA 标 准 的 许多 理由 都 是 相同 的 。SA 标 准 可 能 包括 : 


- DBMS 安 装 和 测试 程序 。 

* 升级 政策 和 程序 。 

* 错误 修复 和 维护 实践 。 

" 变更 即将 发 生 时 ， 要 通知 的 部 门 清单 。 
. 接口 的 考虑 。 


- DBMS 存 储 、 使 用 和 监控 程序 。 


数据 库 应 用 程序 开发 标准 


数据 库 应 用 程序 的 开发 与 典型 的 程序 开发 有 所 不 同 ， 编 写 访问 数据 库 的 程序 时 ， 你 应 记录 下 有 天 开发 的 那些 特殊 考虑 。 数 据 
应 用 程序 开发 的 标准 应 作为 企业 任何 标准 应 用 程序 开发 过 程 的 附属 。 该 套 标准 应 包括 : 


. 描述 出 数据 库 访问 与 平面 文件 访问 的 不 同 之 处 。 

` SQL 编码 标准 。 

. SQL 性 能 技巧 与 技术 。 

. 程序 的 准备 过 程 和 将 SQL 襄 入 应 用 程序 的 方式 指南 。 
. SQL 语句 与 错误 代码 的 解释 。 


- 参考 其 他 有 用 的 有 关 远 程 处 理 监 控 程 序 、 编 程 语言 以 及 一 般 的 应 用 程序 开发 标准 的 编程 材料 。 


数据 库 安全 标准 


DBA 团 队 通 常 申 请 并 管理 DBMS 的 安全 。 然 而 ， 在 一 些 企业 中 ， 企 业 数 据 安全 单元 掌握 着 DBMS 的 安全 。 用 于 概述 必要 的 标 
准 和 管理 数据 库 安全 过 程 的 资源 应 包括 以 下 信息 : 


+ 在 一 些 特定 类 型 的 情况 下 应 授予 何 种 权利 的 详细 说 明 ， 例 如 ， 如 果 一 个 程序 正 迁 移 到 生产 环境 ， 那 么 必须 授予 该 程序 何 种 
DBMS 权 力 ， 它 才能 在 生产 环境 成 功 运行 。 


有 关 任 何 特殊 过 程 的 文档 或 治理 (与 合 规 性 ) 相关 的 请 求 所 需 的 文档 。 

有 关 谁 可 以 批准 何 种 类 型 的 数据 库 授 权 请 求 的 明确 清单 。 

- 任何 用 于 连接 DBMS 安 全 和 操作 系统 安全 产品 的 接口 信息 。 

- 使 用 SQL GRANT 语句 的 WITH GRANT OPTION 子 名 以 及 级 联 REVOKES 如 何 处 理 的 政策 。 
- 通知 请 求 者 数据 库 安 全 已 授予 的 过 程 。 


` 解除 那些 退休 、 调 动 、 解 雇 的 雇员 的 授权 的 过 程 。 


“ 概括 用 于 管理 数据 库 安 全 的 一 些 必 要 标准 和 过 程 。 


概述 必要 的 标准 和 管理 数据 库 安 全 过 程 。 
应 用 程序 的 迁移 与 调整 过 程 


正如 前 面 所 讨论 的 ， 支 持 数据 库 应 用 程序 最 少 也 需要 两 种 环境 : 测试 环境 和 生产 环境 。 而 一 些 企业 还 会 建立 多 种 环境 用 以 文 
持 开 发 生命 周期 的 不 同 阶段 ， 包 括 : 


:单元 测试 ， 用 以 开发 和 测试 个 人 程序 。 

" 集成 测试 ， 用 以 测试 个 人 程序 如 何 互 操作 。 

- 用 户 接受 性 测试 ， 在 生产 环境 之 前 的 终端 用 户 测试 。 
" 质量 保证 ， 用 以 发 现 程序 错误 。 

* 教育 ， 用 以 培训 终端 用 户 该 应 用 程序 系统 的 工作 方式 。 


当 存 在 多 个 环境 时 ， 就 需要 将 数据 库 对 象 和 程序 从 一 个 环境 迁移 到 另 一 个 环境 。 还 需要 具体 的 指南 以 有 利于 各 个 环境 使 用 的 
方式 来 实现 迁移 。 例 如 ， 每 个 环境 所 需 的 数据 容量 是 多 少 ? 测试 时 如 何 保证 数据 的 完整 性 ? 到 底 应 迁移 数据 ， 还 是 仅 调 整数 据 库 
结构 ? 目标 环境 中 已 有 的 数据 该 如 何 处 理 (应 保持 ， 还 是 用 新 数据 覆盖 ) ? 应 制定 综合 的 迁移 过 程 才 可 能 解决 这 些 间 题 。 


需要 将 数据 库 对 象 和 程序 从 一 个 环境 迁移 到 另 一 个 环境 。 


该 迁移 和 调整 过 程 应 记录 任何 的 数据 库 对 象 或 程序 从 一 个 环境 迁移 到 下 一 个 环境 所 需 的 信息 。 至 少 是 迁移 的 请 求 者 会 需要 这 
息 


设计 审查 指南 
所 有 的 数据 库 应 用 程序 在 开发 的 各 个 阶段 都 应 经 受 得 起 设计 审查 。 设 计 审 查 非 常 重 要 ， 它 可 以 保证 应 用 程序 的 设计 、 结 构 和 
性 能 的 正确 性 。 它 可 以 采取 的 方式 也 是 多 种 多 样 的 ， 第 6 章 提供 了 综合 讨论 。 


操作 支持 标准 


操作 支持 被 视 为 IT 企业 的 一 部 分 ， 用 于 监视 数据 库 环 境 并 确保 应 用 程序 都 按照 预定 计划 运行 。 要 想 有 效 地 管理 数据 库 环 境 ， 
必须 提供 足够 的 操作 支持 。 提 供 操作 支持 的 人 员 通 常 处 于 抵御 系统 问题 的 最 前 线 ， 程 序 失败 、 硬 件 失败 以 及 其 他 问题 都 是 由 操作 
支持 人 员 首 先 发 现 ， 然 后 才 让 专家 来 解决 的 。 


操作 支持 确保 应 用 程序 按照 预定 计划 运行 。 


应 制定 标准 用 以 确保 那些 提供 操作 支持 的 人 员 能 够 理解 数据 库 应 用 程序 的 特殊 需求 。 只 要 有 可 能 ,提供 操作 支持 的 全 体 人 员 
应 进行 培训 ， 以 求 在 不 需要 DBA 的 情况 下 也 可 以 解决 简单 的 数据 库 相 关 的 问题 ， 因 为 通常 使 用 DBA 的 代价 是 比较 昂贵 的 。 


2.5 DBMS 教 育 


所 有 使 用 DBMS 技 术 的 企业 都 必须 致力 于 为 DBA、 程 序 员 、 系 统管 理 员 开 设 持续 的 技术 培训 课程 。 提 供 一 份 涵盖 DBM 使 用 
的 方方面面 的 可 选课 程 的 目录 。 至 少 要 开设 以 下 课程 : 


DBMS 综 述 : 一 整 天 的 管理 课程 ， 涵盖 DBMS 所 有 的 基础 知识 。 

+ 数据 建 模 和 数据 库 设计 : 一 系列 深入 的 课程 ， 涵 盖 所 有 针对 DA 和 DBA 概 念 的 、 逻 辑 的 以 及 物理 的 数据 库 设计 技术 。 
* 数据 库 管 理 : 针对 DBA、SA 和 系统 程序 员 的 深入 技术 课程 。 

. SQL 入 门 : 针对 每 位 DBMS 用 户 的 SQL 基 础 的 入 门 级 课程 。 

" SQL 进 阶 ; 针对 DBA 和 程序 员 的 有 关 复杂 SQL 开 发 的 深入 课程 。 

“ 数据 库 编程 : 针对 应 用 程序 编程 人 员 和 系统 分 析 师 的 深入 课程 ， 教 会 他 们 如 何 编写 使 用 DBMS 的 程序 。 


所 有 这 些 课程 对 你 的 企业 所 安装 的 每 个 DBMS 都 是 适用 的 。 此 外 ， 还 需 提供 针对 任何 其 他 数据 库 相 关 的 功能 和 软件 的 培训 ， 
比如 ， 如 何 正 确 使 用 数据 库 实 用 程序 、 查 询 和 报告 工具 以 及 DBA 工 具 。 


致力 于 持续 的 技术 教育 课程 。 


可 以 使 用 多 种 方式 来 提供 DBMS 教 育 ， 比 如 ， 教 师 指导 课程 、 计 算 机 基础 培训 、 网 络 基础 培训 和 远程 教育 。DBM 教育 的 受 
众 包 括 DBMSs 供 应 商 、ISV、 顾 问 公司 (大 的 和 小 的 ， 国 际 的 和 国内 的 ) 和 培训 专员 (如 Themis 和 ProTech) 。 


最 后 ,一 定 要 使 DBMS 的 参考 资料 对 每 一 位 用 户 都 是 可 用 的 。 多 数 DBMS 供 应 商都 在 线 提供 了 通过 Adobe Acrobat 或 
Windows Help 查 看 的 参考 手册 。 保 证 向 每 位 用 户 提供 一 份 手 册 或 者 将 该 手册 放 在 中 央 位 置 ， 以 最 大 程度 地 减少 DBA 回 答 简单 问 
题 的 时 间 ， 而 这 些 问题 都 可 以 在 DBMS 的 文档 里 找 得 到 。 
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建立 一 个 高 效 的 数据 库 环境 需要 综合 的 先行 计划 。 谨 愤 选 择 正确 的 DBMS 技 术 ， 部 署 合 适 的 DBMS 升 级 策略 ， 制 定 有 用 的 数 
据 库 标准 ， 以 及 保证 针对 数据 库 用 户 的 培训 的 持续 性 。 通 过 遵守 本 章 的 指南 ， 你 一 定 可 以 为 企业 实现 高 效 的 数据 库 环 境 。 


然而 ， 搭 建 数据 库 环 境 只 是 开始 。 一 旦 搭建 起 来 ， 你 需要 积极 地 管理 该 数据 库 环 境 ， 以 确保 数据 库 正确 地 创建 和 使 用 ， 并 管 
理 其 性 能 和 可 用 性 。 继 续 阅 读 以 发 现 DBA 是 如 何 实 现 所 有 这 些 任 务 的 。 


2./ [allen 


1. 为 什么 应 执行 数据 库 标 准 ? 如 果 缺 乏 这 些 标准 会 有 什么 风险 ? 


2. 没 有 计划 就 升级 到 新 的 DBMS 版 本 的 潜在 风险 是 什么 ? 


3.DBMS 版 本 和 次 版 本 之 间 的 区 别 是 什么 ? 

4. 说 出 TPC 的 三 个 基准 并 描述 它们 之 间 的 区 别 。 

5. 按 照 各 自 最 适合 的 处 理 类 型 和 本 质 ， 描 述 四 个 级 别 的 DBMS 架 构 。 

6. 计 算 DBMS 所 有 权 总 成 本 (TOC) 时 要 考虑 哪些 因素 ? 

7. 列 出 安装 新 的 DBM 时 必须 要 规划 的 5 种 需求 。 

8. 描 述 支持 DBMS 版 本 的 软件 与 开发 利用 DBMS 版 本 的 软件 的 不 同 。 

9. 对 于 单个 数据 库 对 象 ， 它 应 有 几 种 标准 缩写 ? ATA? 

10. 以 下 创建 一 个 关系 表 的 SQL 代码 有 什么 问题 ? (不 要 从 语法 的 角度 回答 这 个 问题 ， 应 根据 数据 库 命 名 标准 来 考虑 。 ) 


CREATE TABLE tg7r5u99_p 
(cl INTEGER NOT NULL, 
c2 CHAR(5) NOT NULL, 
c9 DATE) 


附加 问题 


你 的 DBMS 供 应 商 ，MegaDataCorp， 只 发 布 了 你 所 使 用 的 DBMS 的 最 新 以 及 最 好 的 MDC 版 本 的 通用 版 。 你 们 的 用 户 和 开 
发 人 员 在 过 去 的 一 年 内 一 直 都 在 要 求 MDC 第 9 版 所 支持 的 几 个 新 功能 。 而 你 们 现在 运行 的 是 MDC 第 7.3 版 。 准 备 一 页 纸 记录 讨论 
升级 到 MDC 第 9 版 的 计划 ， 并 概括 出 你 的 升级 计划 潜在 的 利益 和 风险 。 
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ie ”数据 建 模 与 规范 化 


数据 建 模 是 对 企业 感 兴趣 的 事物 以 及 这 些 事 物 之 间 是 如 何 相互 关联 的 分 析 过 程 。 此 过 程 可 使 你 友 现 并 记录 你 的 业务 数据 资 
源 。 数 据 建 模 问 的 是 “是 什么 ”的 问题 ， 而 更 多 常见 的 数据 处 理 的 是 “如 何 做 ”的 问题 。 


数据 建 模 问 的 是 “是 什么 ”的 问题 。 


在 部 署 任 何 形式 的 数据 库 之 前 ，DBA 都 需要 开发 一 种 数据 存储 的 有 效 模型 。 数 据 库 开发 的 初学 者 通常 会 以 一 种 “快速 而 拙 
劣 ” 的 方法 来 部 署 数据 库 。 他 们 以 编程 者 的 视角 来 进行 数据 库 的 设计 ， 因 为 初学 者 往往 缺乏 数据 库 以 及 数据 需求 收集 的 经 验 ， 他 
们 试图 将 数据 库 设计 得 如 同 他 们 习惯 使 用 的 平面 文件 一 样 。 这 是 个 重大 的 错误 ， 实 际 上 ， 当 数据 库 和 应 用 程序 在 生产 环境 运行 
后 ， 大 多 数 使 用 这 种 方法 的 开发 人 员 很 快 就 会 发 现 问题 。 至 少 ， 性 能 将 受到 影响 ， 数 据 也 不 像 预期 那样 容易 获得 。 在 最 坏 的 情况 
下 ， 可 能 引发 数据 完整 性 问题 或 性 能 问题 ， 中] 使 整个 应 用 程序 无 法 使 用 。 


一 个 设计 合理 的 数据 库 不 可 能 由 初学 者 匆匆 拼凑 而 成 。 所 需要 的 是 通过 一 种 熟练 的 、 正 式 的 方法 来 收集 数据 需求 和 对 数据 建 
模 ( 即 实体 ) 以 及 数据 元 素 的 发 现 与 识别 。 数 据 标准 化 是 数据 建 模 和 数据 库 设计 的 重要 组 成 部 分 ， 标 准 化 的 数据 模型 确保 数据 元 
素 设计 合理 ， 减 少数 据 元 余 和 不 一 致 性 。 


实际 上 ， 基 本 的 数据 建 模 知识 非常 简单 ， 但 要 掌握 其 中 所 有 的 细微 差别 可 能 需要 一 生 的 时 间 。 本 章 介绍 了 数据 建 模 和 标准 化 
的 概念 ， 并 提供 了 一 些 正 确 使 用 它们 的 通用 准则 。 


经 验 丰 富 的 数据 建 模 师 和 DA 可 能 会 发 现 本 章 中 的 材料 并 不 完整 。 写 作 的 初衷 就 是 向 DBA 介 绍 一 些 概念 并 引导 他 们 沿 着 正确 
的 道路 ， 利 用 合理 的 数据 模型 产生 数据 库 。 完 全 了 解数 据 建 模 需要 全 面 的 学 习 ， 大 量 现 有 的 书籍 都 详尽 地 介绍 了 数据 建 模 和 标准 
化 。 更 多 有 关 数 据 建 模 的 详细 信息 请 查阅 本 章 结 尾 建 议 参考 的 书籍 。 


[1] 当 Mictosoft Access 开 发 人 员 党 试 将 单 用 户 应 用 程序 转换 到 Mictosoft SQL Setrvet 或 Otacle， 由 于 悲观 锁 的 并 发 ， 常 会 出 现 性 能 问 


日 


题 。 


3.1 ”数据 建 模 的 概念 


下 面 用 一 则 民间 流行 的 盲人 摸 象 的 故事 来 说 明 数 据 建 模 的 目的 : 


有 四 个 盲人 在 他 们 的 旅行 中 碰巧 遇 到 一 头 大 象 ， 他 们 以 前 从 没 遇 到 过 大 象 ， 但 还 是 很 好 奇 。 因 此 ， 每 个 盲人 都 试图 通过 触摸 
来 了 解 大 象 是 什么 样子 。 第 一 个 育 人 摸 着 大 象 的 鼻子 惊 呼 道 : “天 啊 ! 原来 大 象 像 条 蛇 啊 ， 又 长 又 光滑 。” 第 二 个 盲人 伸手 摸 到 
了 大 象 的 侧面 ， 他 申辩 说 : “不 对 ， 大 象 更 像 一 堵 墙 ， 平 整 又 厚实 。” 第 三 个 育 人 有 些 困惑 了 ， 他 伸 出 手 去 摸 大 象 却 摸 到 了 大 象 
的 长 牙 ， 他 说 道 : “不 对 ， 你 们 都 错 了 ， 大 象 更 像 是 一 个 长 予 ! ”第 四 个 盲人 抓 住 了 大 象 的 腿 大 喊 道 : “你 们 都 错 了 ， 大 象 更 像 


是 一 棵 树 ， 圆 滑 又 结实 。” 


好 了 ， 每 个 盲人 都 是 正确 的 ， 也 都 是 错误 的 。 问 题 不 是 出 在 每 个 盲人 的 经 验 上 ， 而 是 经 验 的 范围 上 。 要 想 成 为 一 名 成 功 的 数 
据 建 模 师 ， 必 须 学 会 发 现 业务 数据 需求 的 全 部 真相 。 不 能 依赖 个 别 用 户 或 者 个 别 专家 的 需求 ， 因 为 那个 人 的 经 验 范围 可 能 并 不 全 
面 。 数 据 建 模 的 目标 是 记录 业务 流程 的 数据 需求 ， 各 业务 数据 模型 的 范围 必须 是 全 面 的 。 如 果 一 个 企业 存在 企业 数据 模型 ， 那 么 
每 个 单独 的 业务 数据 模型 的 正确 与 否 都 要 与 该 企业 数据 模型 进行 对 比 验 证 。 


数据 建 模 的 目标 是 记录 业务 过 程 的 数据 需求 。 


在 最 基本 的 层面 上 ， 数 据 建 模 始 于 一 个 概念 上 的 冒险 。 概 念 上 的 数据 建 模 的 首要 目标 是 了 解 需求 。 一 个 数据 模型 ， 就 其 本 身 
而 言 ， 价 值 非常 有 限 。 当 然 ， 它 通过 增强 (使 用 数据 的 人 ) 沟通 和 理解 (对 数据 ) 来 体现 其 价值 ， 可 以 说 这 些 都 是 非常 有 价值 
的 。 然 而 ， 数 据 模 型 的 主要 价值 是 其 能 够 作为 构建 物理 数据 库 的 蓝图 。 


如 果 数 据 库 的 构建 源 自 一 个 设计 良好 的 数据 模型 ， 由 此 产生 的 结构 可 以 给 企业 带 来 更 多 的 价值 。 数 据 模 型 的 价值 在 于 : 数据 
匈 余 最 小 化 ， 数 据 完整 性 最 大 化 ， 稳 定性 增加 ， 更 好 的 数据 共享 ， 一 致 性 增加 ， 数 据 访问 更 及 时 ， 更 好 的 数据 可 用 性 。 之 所 以 可 


以 达到 这 些 品 质 ， 是 因为 数据 模型 以 一 种 简洁 明了 的 方式 清晰 地 概括 了 数据 资源 的 需求 和 关系 。 由 数据 模型 搭建 的 数据 库 将 更 易 
于 部 署 ， 因 为 这 时 候 你 已 经 对 存储 在 数据 库 中 的 数据 有 了 更 好 的 理解 。 


企业 数据 模型 


企业 数据 模型 是 可 以 全 面 描述 整个 企业 的 数据 需求 的 单一 数据 模型 。 本 章 讨 论 数据 模型 是 因为 它们 与 个 人 项 目 或 应 用 程序 相 
关 ， 而 并 不 是 企业 数据 模型 中 相对 高 级 的 主题 。 管 理 和 维护 企业 数据 模型 会 受到 许多 数据 库 以 外 的 其 他 因素 的 干扰 ， 如 公司 政治 
以 及 难以 量化 的 ROI。 


如 果 你 的 企业 决定 致力 于 开发 并 维护 企业 数据 模型 ， 你 绝对 需要 花 些 时 间 来 阅读 有 关 这 一 主题 的 更 多 内 容 ， 可 以 参考 本 章 结 
尾 推 荐 的 书籍 。 


数据 建 模 的 另外 一 个 好 处 是 有 机 会 发 掘 数据 的 新 用 途 。 数 据 模型 可 以 前 明 数 据 模 式 和 数据 可 能 被 埋没 的 潜在 用 途 。 这 些 模式 
的 发 掘 可 以 改变 你 的 业务 经 莒 方式 ， 也 可 能 会 提高 竞争 优势 ， 从 而 使 企业 增加 收益 。 


数据 模型 可 以 冰 明 数据 模式 和 数据 的 潜在 用 途 。 


数据 建 模 与 应 用 程序 开发 和 面向 过 程 的 任务 的 需求 收集 所 需要 的 心态 不 同 。 前 者 认为 重要 的 是 要 考虑 “是 什么 ” 感 兴趣 的 ， 
而 不 是 任务 “如 何 做 ”实现 的 。 要 过 渡 到 这 种 思维 方式 ， 需 要 遵循 以 下 三 个 准则 : 


* 不 考虑 物理 的 ， 考 虑 概念 的 。 关 心 业 务 问 题 和 条 款 ， 而 不 是 物理 存储 问题 和 DBMS 约束 。 


* 不 考虑 进程 ， 考 虑 结构 。 事 情 是 如 何 完 成 的 ， 对 应 用 程序 开发 重要 ， 而 对 数据 建 模 却 不 重要 。 数 据 建 模 关 心 的 是 事情 正 应 
用 于 哪些 进程 。 


* 不 考虑 导航 ， 考 虑 关联 。 事 情 相 互 关联 的 方式 很 重要 ， 因 为 关联 映射 了 数据 模型 。 对 于 概念 上 的 逻辑 数据 建 模 来 说 ， 访 问 
关联 的 方式 并 不 重要 。 


请 记 住 ， 一 旦 创建 了 数据 模型 ， 企 业 的 业务 词典 也 就 完成 了 。 如 同一 个 给 定 了 语言 的 词典 ， 数 据 模 型 就 像 业务 术语 及 其 用 法 
的 词典 。 


实体 关系 图 表 


数据 模型 通常 以 实体 关系 图 表 的 形式 呈现 ， 简 称 E/R 图 。E/R 图 生动 地 描述 了 数据 模型 的 实体 和 关系 。 图 3-1 显 示 了 一 个 示例 
E/R 图 。 该 图 使 用 了 Erwin (EF) 款 领先 的 数据 建 模 和 设计 工具 。 许 多 供应 商都 提供 了 流行 的 数据 建 模 的 工具 ， 关 于 数 
据 建 模 工具 及 其 供应 商 的 列表 ， 请 参考 附录 C。 


已/R 图 生动 地 描述 了 数据 模型 的 实体 和 关系 。 


E/R 图 可 以 描述 多 种 图 表 方 法 和 技术 。 不 管用 什么 方法 ，E/R 图 都 采用 方 框 表示 实体 ， 采 用 线条 或 箭头 表示 关系 。 方 框 和 线 
条 的 格式 根据 图 表 方 法 的 不 同 而 有 所 不 同 。 图 3-2 显 示 了 几 种 最 常见 的 E/R 图 表 方 法 。 


MOVIE 


MovieNum | 


Name 
Director 
Description 
Star 

4 Rating 
Genre 
RentalRate 


EMPLOYEE 


|EmployeeNum | 
Name 
Address 

Phone 

SSNum 
HireDate 
Salary 
Supervisor (FK) 


CUSTOMER 


[CustomerNum _ 


Name 


JoinDate 
CreditCardNum 

CreditCardExDate 
StatusCode 


PaymentTransNum 
Type 

Amount 
PaymentDate 
Status 


Address MOVIE RENTAL RECORD 
if ae 
Phone 租用 记录 于 [RentalRecDate 


RentalDate 
DueDate 
RentalStatus 
RentalRate 
OverdueCharge 


MOVIE COPY 


MovieCopyNum 


GeneralCond 


租用 的 形式 


SY 


被 租用 记录 于 


图 3-1 EE/R 图 示例 
一 对 一 一 对 多 多 对 多 
1 | |EMPLOYEE TEMP_EMP CUSTOMER ACCOUNT STUDENT COURSE 
EMPLOYEE TEMP_EMP CUSTOMER |<——> ACCOUNT STUDENT COURSE 


3 | [EMPLOYEE CUSTOMER ACCOUNT 


TEMP_EMP 


STUDENT COURSE 


1 -一 M ACCOUNT 


EMPLOYEE —<>HTEMP EMP 
5 | [EMPLOYEE TEMP EMP 


CUSTOMER 


ACCOUNT 


CUSTOMER 


STUDENT | M—<>M COURSE 
STUDENT COURSE 


图 3-2 E/RA AK 


(1) Rosse (2) Bachmann, (3) Martin. (4) Chen. 


(5) Rumbaugh 
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+ Flight_Number : char 
+ Destination : char 

+ Departure : char 

+ Flight_Date : char 

+ Flight_Time : char 
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+ Flight_Price : float Flight_Reservation 


+ Reservation_Availability : boolean + Airline _Name : char 


+ Ticket_Price : float 

+ Flight_Date : char 

+ Flight_Time : char 

+ Flight_Number : int 

+ Ticket_Number : char 


- Reservation_Number : char 
- Passenger_Name : char 
+ Flight_Number : char 


+ Provide_Flight_Details () : void 
+ Confirm_Booking () : boolean 


persistent 


1.* persistent 


schedules A persistent 


Travel_Agent Airline_Ticket_Vendor 


Airline 


+ Vendor_Name : char 
+ Vendor_Address : char 


persistent | persistent 


图 3-3 UML 类 图 示例 (使 用 [BM Rational A 422744 4 #) 


+ Airline_Name : char 
+ Airline_Address : char 


+ Schedule_Flight () : void 


persistent 


不 能 说 哪 种 方法 最 好 ， 只 要 选择 一 种 坚持 下 去 ， 就 可 以 最 大 程度 地 减少 混乱 。 不 同 的 建 模 团队 使 用 不 同 的 图 表 技 术 将 使 数据 
模型 的 知识 分 享 变 得 困难 ， 如 果 人 存在 企业 数据 模型 ， 还 会 使 数据 模型 合并 到 企业 的 数据 模型 更 加 复杂 。 


再 来 看 图 3-2， 图 表 方法 之 间 最 大 的 区 别 在 于 基数 显示 的 方式 。 基 数 是 指 一 个 实体 可 以 采用 的 实例 的 最 大 数 。 图 3-2 的 每 一 
行 都 显示 了 不 同 的 E/R 图 风格 是 如 何 处 理 一 对 一 、 一 对 多 、 多 对 多 关系 的 。 这 些 E/R 图 方法 都 是 以 该 技术 鼻祖 的 名 字 来 命名 的 ， 
按照 行 来 说 ， 图 3-2 所 描述 的 图 表 技 术 的 名 字 分 别 为 Ross、Bachmann、Martin、Chen 和 Rumbaugh。 


大 多 数 建 模 工具 支持 一 种 或 几 种 图 表 技 术 ， 最 受 欢 迎 的 图 表 技 术 是 Martin (也 叫做 信息 工程 法 ) 和 Ross。 图 3-1 的 E/R 图 就 
是 用 Martin 技 术 创建 的 。 排 除 流行 一 说 ， 每 一 种 技术 都 有 许多 数据 建 模 师 使 用 ， 选 择 对 你 的 企业 最 容易 使 用 和 理解 的 那 种 即 
可 。 


另 一 种 流行 的 建 模 技术 叫做 统一 建 模 语言 (UML) 。UML 合 并 了 几 种 流行 的 面向 对 象 的 符号 和 概念 ， 源 于 Grady Booch, 
James Rumbaugh 和 Ilvar Jacobson 的 工作 。 它 为 面向 对 象 的 系统 建 模 提供 了 一 套 标 准 的 图 表 和 符号 集 。 实 际 上 ，UML 为 不 同 
类 型 的 系统 建 模 定义 了 9 种 类 型 的 图 表 。UML 类 图 可 用 作 模 型 数据 ， 而 传统 的 E/R 图 捕获 了 纯粹 数据 的 详细 信息 ， 因 此 比 UML 更 
适用 于 数据 建 模 和 关系 数据 库 设 计 。 图 3-3 显 示 的 UML 类 图 的 示例 描述 了 一 家 航空 公司 的 数据 模型 。 由 于 对 象 由 数据 和 过 程 组 
成 ，UML 不 只 是 一 种 数据 建 模 图 表 技 术 。 


3.2 ”数据 模型 的 组 件 


数据 模型 由 许多 不 同 的 组 件 (对 真实 世界 中 事物 的 抽象 ) 构建 而 成 。 最 简单 的 数据 模型 由 实体 和 天 系 构成 。 在 数据 模型 发 展 
的 同时 ， 加 入 了 更 多 的 细节 ， 复 杂 度 也 随 之 增加 。 接 下 来 研究 数据 模型 的 各 种 不 同 组 件 以 及 用 于 数据 建 模 的 术语 。 


3.2.1 实体 


从 最 基本 的 层面 来 说 ， 实 休 是 存在 且 能 够 描述 的 事物 。 它 可 以 是 人 、 地 方 、 事 情 、 概 念 或 有 关 企业 支撑 某 些 事实 的 事件 。 例 
如 ，STUDENT、INSTRUCTOR 和 COURSE 都 是 学 院 或 大 学 必须 了 解 来 完成 业务 的 具体 实体 。 


实体 是 人 人、 地方、 事情 、 概 念 或 事件 。 
实体 命名 指南 


在 数据 模型 内 部 ， 实 体 的 命名 遵循 严格 的 标准 很 重要 。 如 果 开 发 人 员 试 图 使 用 定义 糟糕 且 非 标准 的 名 称 来 进行 交流 ， 将 会 产 
生 混 乱 。 好 的 标准 通常 使 用 大 写 英文 字母 并 以 单数 形式 命名 实体 。 实 体 应 看 作 处 于 其 中 的 实例 模式 ， 而 不 是 该 类 型 实体 的 所 有 实 
例 集合 。 例 如 ， 一 个 包含 公司 雇员 的 数据 实体 应 命名 为 EMPLOYEE， 而 不 是 EMPLOYEES。 


此 外 ， 实 体 通常 是 名 词 或 形容 词 与 名 词 的 组 合 。 应 尽量 减少 使 用 形容 词 ， 因 为 有 些 时 候 ， 形 容 词 可 以 伪装 成 一 个 属性 。 例 
如 ， 一 个 名 叫 CONTRACT EMPLOYEE 的 实体 可 以 更 好 地 表示 一 个 实体 ， 名 字 叫 EMPLOYEE 目 还 有 一 个 描述 雇员 状态 的 属性 
(状态 的 值 可 以 是 FULLTIME 或 CONTRACT) 。 


实体 通常 是 名 词 或 形容 词 与 名 词 的 组 合 。 


促进 选用 实体 术语 的 一 致 性 。 一 般 来 说 ， 使 用 业务 用 户 喜 欢 的 术语 。 如 果 同 一 个 实体 使 用 了 多 个 术语 ， 且 没有 明确 的 共识 ， 
那么 选择 其 中 一 个 使 用 。 例 如 ， 如 果 一 些 用 户 喜 欢 VENDOR 而 另外 一 些 却 喜欢 SUPPLIER， 选 择 任 何 一 个 且 在 整个 数据 模型 中 都 
使 用 它 。 某 些 时 候 ， 当 不 好 为 业务 选择 术语 时 ， 可 和 凭借 常识 来 选择 。 例 如 ，CLIENT 或 许 比 USER 更 好 ， 因 为 有 时 会 赋予 这 个 词 一 
些 负面 的 含义 (毒药 用 户 ) 。 


最 后 ， 去 掉 实 体 名 称 中 表示 特定 过 程 的 词语 ， 例 如 ，AGENT 比 SELLING AGENT 更 好 。 需 要 谨 记 ， 数 据 模型 应 捕获 的 
是 “是 什么 ”而 非 “ 如 何 做 ”， 而 “selling” 就 描述 了 一 个 过 程 。 
实体 实例 


实体 的 实例 称 作 实体 实例 。 例 如 ，AUTHOR 是 一 个 实体 ，Craig S.Mullins 以 及 所 有 描述 性 的 细节 就 是 实体 AUTHOR 的 一 个 
实例 。 区 分 抽象 的 实体 与 具体 的 实体 实例 非常 重要 。 另 外 ，Entity Instance 与 Entity Occurrence 是 同义词 ， 都 表示 实体 实例 。 


实体 的 实例 称 作 实 体 实 例 。 


3.2.2 属性 


实体 所 具有 的 某 一 特性 称 为 属性 。 属 性 的 作用 有 三 种 : 


* 标识 ， 用 于 标识 的 属性 是 候选 键 。 如 果 所 标识 属性 的 值 改变 了 ， 该 属性 就 标识 另外 的 实体 实例 了 。 用 于 标识 的 属性 应 是 一 
成 不 变 的 。 


" 关联 ， 用 于 关联 实体 的 属性 是 外 部 键 。 该 属性 是 指 另 一 个 (或 同一 个 ) 实体 实例 的 主键 的 属性 。 
描述， 如 果 一 个 属性 描述 或 表示 《而 非 标识 或 关联 ) 一 个 实体 实例 的 特点 ， 那 么 该 属性 即 描述 性 属性 。 


一 般 来 说 ， 名 词 往往 表示 实体 ， 形 容 词 往往 表示 属性 。 然 而 ， 该 规则 并 非 一 成 不 变 的 : 一 定 要 运用 业务 知识 来 确定 哪些 名 词 
和 属性 是 实体 ， 哪 些 是 属性 。 每 个 属性 必须 标识 实体 实例 ， 关 联 一 个 实体 实例 到 另 一 个 实体 实例 (在 同一 个 或 另 一 个 实体 中 ) ， 


或 描述 实体 实例 。 


属性 必须 明确 地 反映 其 具体 的 本 意 。 一 个 属性 的 实例 在 本 质 上 必须 是 原子 的 。 也 就 是 说 ， 一 个 属性 代表 一 个 独特 的 事实 ， 不 
能 进一步 分 解 。 基 于 此 ， 使 用 Name 作 为 实体 PERSON 的 属性 并 不 是 很 好 的 做 法 ， 因 为 Name 还 可 以 分 解 为 名 、 中 间 名 和 姓 。 


每 个 属性 都 分 配 了 有 效 的 域 。 域 定义 了 数据 元 素 有 效 值 的 范围 。 一 个 有 关 域 的 例子 : 1 到 10 之 间 的 有 效 正 整数 。 数 据 类 型 是 
域 的 组 成 部 分 ， 它 恰当 地 指定 组 成 域 的 数据 的 类 型 ， 如 整数 、 小 数 、 字 符 、 日 期 和 时 间 等 。 


如 果 定 义 一 个 属性 表示 一 段 代码 ， 该 代码 段 的 域 (如 果 可 能 ) 应 由 自 记 录 的 值 组 成 。 例 如 ， 用 于 表示 每 周 、 每 月 、 每 季度 、 
每 年 这 些 周期 频率 的 属性 的 域 , 定义 为 (“W”、“M”、“Q” 、"Y”) 比 (“1”、“2”、“3”、“4”) 更 好 。 前 者 是 
自 记 录 的 且 便 于 记忆 ， 后 者 不 便于 记忆 。 


域 定义 了 数据 元 素 有 效 值 的 范围 。 
属性 命名 指南 


制定 并 遵守 一 种 属性 命名 的 标准 格式 。 例 如 ， 如 果 以 驼峰 式 大 小 写 ( “FirstName” ) 的 独特 格式 命名 了 属性 ， 那 么 就 不 要 
随便 将 它 全 部 转换 成 小 写 (“first_ name”) 。 选 择 一 种 格式 并 一 直 沿 用 。 实 体 EMPLOYEE 的 一 些 潜在 属性 名 称 可 能 是 
StreetAddress (或 street address) 、ZipCode (或 zip_ code) 和 Employeeld (或 employee id) 。 问 题 的 关键 不 是 花费 很 多 
时 间 来 确定 属性 命名 的 明确 标准 ， 而 是 选择 一 种 标准 并 一 直 沿 用 ， 才 可 以 最 大 程度 地 减 小 混淆 和 明确 沟通 。 


遵守 一 种 属性 命名 的 标准 格式 。 


属性 名 称 应 由 一 个 基本 描述 性 单词 加 上 一 个 类 单词 组 成 。 类 单词 描述 了 大 部 分 信息 系统 常见 的 属性 的 一 个 特殊 子 集 。 如 果 有 
可 能 ， 还 可 以 相应 使 用 其 他 符合 资格 的 单词 来 定义 属性 。 基 本 描述 性 单词 可 以 是 实体 名 ， 也 可 以 是 其 他 描述 性 单词 。 类 单词 为 在 
用 的 域 的 类 型 建立 了 有 效 的 类 列表 。 表 3-1 显 示 了 可 能 的 类 示例 列表 。 你 可 以 使 用 整个 类 名 或 者 其 标准 缩写 。 下 面 举 几 个 属性 名 
称 的 例子 。 


- VendorID， 这 里 的 Vendot 是 实体 ， 该 属性 是 一 个 标识 符 。 
- ProductName， 这 里 的 Product 是 实体 ， 该 属性 的 域 是 字母 、 字 符 名 称 。 


ProductYeatlySalesAmount， 这 里 的 Product 是 实体 ， 域 是 一 个 数额 。 然 而 ， 每 个 产品 实例 可 能 有 多 个 数额 。 此 特殊 的 属性 用 
Yearly (表示 阶段 ) 和 Sales (表示 卖 掉 的 数额 ， 而 非 购买 的 数额 ) 进行 了 进一步 限制 。 


表 3-1 属性 类 单词 示例 


缩 写 
Address 街 a 外 或 位 置 ADDR 


Audio IG 子音 Fists 音 记 录 AUD 


& 描 述 缩 写 

Code 代码 、 类 型 和 分 类 ADE 
Description 描述 性 文本 DSC 
Identifier 唯一 标识 符 ID 
Image 数字 图 像 IMG 
Name 字母 、 字 符 名 称 NME 
Number 数字 计数 需 NUM 
Percentage 数字 比例 或 百分比 PCT 
Quantity 数值 单位 或 数量 ( 非 货币 ) QTY 
Text 自由 格式 的 文本 文档 TXT 
Time 钟表 时 间 TME 


Video 数字 视频 流 、 移 动 影像 VID 


同音 异 义 词 和 同义词 


根据 书 氏 词典 的 英语 用 法 〈 在 线 版 本 ) : 

Homonyms, % 74] 

1: 拼写 以 及 发 音 相 似 ， 意 思 却 不 相同 (如 名 词 旦 惧 quail 和 动词 哑 惧 quail) 的 两 个 或 多 个 单词 。 
Synonyms， 名 词 

1: 在 一 些 或 所 有 句子 中 表示 相同 或 相近 意思 的 两 个 或 多 个 单词 或 使 用 同一 语言 的 表达 。 


在 数据 建 模 中 使 用 同音 异 义 词 和 同义词 会 引起 混淆 。 前 者 必须 通过 上 下 文才 能 理解 它 的 具体 含义 。 当 两 个 单词 的 拼写 和 发 音 
均 相 同时 ， 识别 它们 的 唯一 方法 就 是 研究 它们 是 如 何 使 用 的 。 例 如 ， 如 果 单 说 “watch” 一 词 ， 你 能 理解 它 表示 手表 呢 ， 还 是 表 
示 让 你 看 某 些 东西 呢 ? 缺少 了 上 下 文 ， 就 无 从 知晓 。 


后 者 (同义词 ) 引起 混 消 的 原因 则 不 同 。 当 同一 个 事物 用 几 种 不 同 的 方式 表示 时 ， 多 个 词 用 来 表示 该 事物 则 会 变 得 不 清晰 。 


例如 ，“client” 和 “customer” 表 示 同 一 个 意思 吗 ? 


尽管 两 者 在 商业 活动 中 不 能 被 禁止 ， 在 数据 建 模 和 数据 库 设 计 范 围 内 还 是 可 以 禁止 的 。 作 为 数据 建 模 师 的 你 一 定 要 这 么 做 。 
然而 ， 不 要 强 连 业务 线 用 户 采 用 该 术语 来 改变 他 们 当前 的 使 用 习惯 。 而 是 要 与 数据 模型 中 的 保持 一 致 ， 并 允许 用 户 不 修改 他 们 的 
词典 就 能 继续 他 们 当前 的 实践 。 然 而 ， 一 定 要 记录 下 同音 异 义 词 和 同义词 的 所 有 商业 用 法 。 


类 单词 不 应 具有 多 重 意义 。 


一 方面 ， 类 单词 列表 可 能 不 同 。 另 一 方面 ， 该 列表 也 可 能 相同 ， 只 是 拥有 不 同 的 缩写 。 无 论 如 何 ， 只 要 制定 并 坚持 使 用 类 单 
词 列 表 即 可 。 类 单词 不 应 具有 多 重 意义 。 每 个 域 有 且 只 能 有 一 个 类 单词 。 此 外 ， 定 义 类 单词 时 应 避免 使 用 同音 异 义 词 和 同义词 。 
还 需要 记 住 的 是 ， 这 些 类 单词 仅 对 逻辑 数据 模型 至 天 重要 ， 而 由 于 DBMS 对 象 名 称 的 限制 ， 它 们 不 会 用 于 物理 数据 库 。 


属性 值 


属性 的 实例 称 为 属性 值 。 值 “Craig” 就 是 实体 AUTHOR 的 FirstName 属 性 的 属性 值 。 从 具体 的 属性 值 中 区 分 抽象 的 属性 很 
重要 。 


空 值 与 缺少 值 
对 于 属性 来 说 ， 空 值 代表 值 丢 失 或 信息 未 知 。 如 果 某 个 属性 值 为 空 ， 表 示 两 种 含义 : 该 属性 不 适用 于 某 个 实体 实例 ， 或 者 该 
属性 适用 于 所 有 的 实体 实例 ， 但 信息 可 能 未 知 。 当 然 ， 这 两 种 情况 也 可 能 同时 出 现 。 


例如 ， 假 设 实体 STUDENT 包含 属性 HairColor， 另 外 ， 该 属性 可 以 为 空 。 空 的 HairColor 又 代表 什么 呢 ? 看 一 下 三 种 潜在 的 
实体 实例 : 黑头 发 的 男人 、 未 知 发 色 的 女人 以 及 秃头 的 男人 。 未 知 发 色 的 女人 和 秃头 的 男人 都 可 以 赋 空 值 ， 原 因 却 不 相同 。 未 知 
发 色 的 女人 的 HairColor 为 空 意味 着 “暂时 未 知 ”， 而 秃头 的 男人 的 HairColor 为 空 则 意味 着 “不 适用 ”。 


当然 了 ， 可 以 通过 扩展 颜色 的 域 使 之 包含 值 “ 秀 头 ”来 表示 秃头 男人 的 HairColor。 但 如 果 扩 展 域 不 可 行 呢 ? 例如 ， 实 体 
EMPLOYEE 的 TerminationDate 属 性 的 某 个 日 期 ， 日 期 的 域 是 日 历 上 所 有 的 日 期 ， 它 不 太 可 能 被 赋予 一 个 “未 知 ” 的 特殊 值 。 
而 对 于 实例 EMPLOYEE 的 TerminationDate 的 值 ， 空 值 (意味 着 未 知 ) 远 比 一 个 有 效 的 日 期 合适 ， 不 管 该 日 期 多 遥远 ， 不 是 
吗 ? 


空 值 代表 值 丢失 或 信息 未 知 。 
不 可 用 的 空 值 可 能 预示 着 设计 问题 


使 用 空 值 来 表示 “不 可 用 ”可 能 预 示 着 数据 设计 不 正确 。 通 过 恰当 的 建 模 以 及 数据 结构 规范 化 ， 往 往 可 以 消除 使 用 空 值 来 表 
示 某 列 对 于 某 特 定 的 行 不 适用 。 


正确 规范 化 的 数据 模型 应 使 每 个 属性 值 都 依赖 实体 实例 的 主键 。 如 果 某 个 特殊 的 属性 “不 可 用 ”， 大 概 就 是 设计 不 规范 。 


关 更 多 规范 化 的 信息 ， 请 查阅 本 章 3.5 节 。 
制定 数据 模型 时 一 定 要 考虑 空 值 的 细微 差别 ， 仔 细 研 究 每 个 属性 的 为 空 性 。 


通常 Null 会 被 不 恰当 地 认为 空 值 。 使 用 术语 value 来 描述 空 并 不 准确 ， 因 为 术语 null 意 味 着 lack 值 。 


ae 机 


码 由 一 个 或 多 个 属性 组 成 ， 其 值 唯 一 标识 实体 实例 并 定义 实体 间 的 关联 。 更 准确 地 说 ,候选 码 和 主 码 标识 实体 。 一 个 实体 的 
主 码 值 与 另 一 个 实体 的 外 码 值 共同 标识 关联 。 例 如 ， 如 果 CustNo 是 实体 CUSTOMER 的 主 码 ， 它 将 用 作 相 关 实体 (如 
CUSTOMER_CONTACT) 的 外 码 。 一 个 客户 可 以 有 多 个 联系 人 ， 所 以 客户 的 每 个 联系 人 都 要 注册 CustNo。 


码 不 应 具有 嵌入 的 含义 。 码 的 用 途 是 标识 ， 而 非 描述 。 描 述 由 实体 的 其 他 属性 负责 。 如 果 码 具 有 谋 入 的 合 义 ,含义 一 旦 改 
变 ， 问 题 就 会 出 现 。 此 外 ， 任 何 嵌 入 含义 的 值 都 有 可 能 失去 控制 ， 也 会 引起 数据 完整 性 和 修改 问题 。 


码 由 标识 实体 实例 的 属性 组 成 ， 并 定义 了 实体 间 的 关联 。 


每 个 实体 都 可 以 拥有 多 个 侯 选 码 ， 但 至 少 要 有 一 个 。 候 选 码 是 一 种 可 唯一 标识 实体 实例 的 属性 或 属性 的 子 集 。 如 果 属 性 的 值 
不 能 用 来 标识 实体 的 具体 实例 ， 那 么 它 就 不 能 作为 候选 码 。 


生得 


每 个 实体 都 有 且 仅 有 一 个 主 码 。 主 码 从 一 组 候选 码 中 选 出 且 用 来 标识 实体 实例 。 选 择 恰当 的 主 码 至 关 重要 ， 因 为 主 码 将 用 于 
定义 相关 的 从 属实 体 的 外 码 。 


好 的 主 码 包括 以 下 几 种 特征 : 

+ 主 码 必 须 保 证 实体 实例 的 唯一 性 。 

. 主 码 任何 分 量 的 值 都 不 能 为 室 。 

. 基本 实体 的 主 码 不 应 具有 嵌入 的 含义 。 

. 主 码 是 不 可 变 的 ， 即 不 可 或 不 易 改 变 。 

此 外 ， 应 控制 主 码 的 值 。 如 果 值 由 外 部 分 配 ， 则 容易 失控 ， 进 而 可 能 引起 数据 问题 。 其 中 ， 确 保 码 的 值 始终 唯一 就 不 太 可 
能 。 例 如 ， 社 会 安全 号 码 不 是 理想 的 标识 雇员 的 主 码 ， 因 为 它 在 外 部 分 配 。 或 许 ， 由 企业 内 部 分 配 数 字 标 识 符 是 个 不 错 的 选择 。 


外 码 


外 码 存 在于 从 属实 体内 部 ， 用 于 建立 关联 。 主 码 标识 实体 实例 ， 外 码 则 识别 实体 实例 间 的 关联 。 对 于 一 对 多 的 关联 ， 外 码 始 
终 取 决 于 关联 较 多 的 一 方 。 对 于 一 对 一 的 关联 ， 确 定 外 码 的 位 置 会 比较 困难 。 基 本 原则 是 分 析 属 性 并 将 码 分 配给 最 具 特 色 的 实 
体 。 如 果 一 对 一 关联 的 一 方 可 选 ， 那 么 该 方 的 实体 应 包含 外 码 ， 而 另外 一 方 的 实体 包含 主 码 。 


3.24 关联 

关联 定义 了 不 同 的 实体 间 是 如 何 相互 联系 的 。 关 联 的 名 称 应 说 明 一 个 实体 与 另外 的 (或 同一 个 ) 实体 联合 所 起 的 作用 。 码 定 
义 关 联 : 父 实体 中 是 主 码 ， 从 属实 体 中 是 外 码 。 

关联 定义 了 不 同 的 实体 间 是 如 何 相 互联 系 的 。 


关联 不 只 是 联系 实体 之 间 的 “ 线 ”， 还 让 数据 模型 变 得 有 意义 ， 因 此 应 赋予 有 意义 的 名 称 。 关 联 的 名 称 如 实 陈述 了 实体 间 的 
联系 。 例 如 ， 两 个 实体 COURSE 和 INSTRUCTOR 的 一 对 多 的 关联 ， 每 门 COURSE 有 且 仅 有 一 名 INSTRUCTOR, 而 一 名 
INSTRUCTOR 可 能 教 多 门 COURSE。 关 联 的 名 称 (本 例 中 “is-taught-by”) 加 上 参与 这 种 关联 的 实体 的 名 称 ， 就 可 以 组 成 一 
个 有 实际 意义 的 句子 。 


在 E/R 图 中 ， 关 联 应 从 右 向 左 按 顺 时 针 方 向 来 读 。 遵 守 此 约定 可 保证 数据 模型 的 易 读 性 。 
基数 


基数 (cardinality) 是 存在 于 一 对 实体 中 的 实例 的 数量 。 另 外 ， 基 数 还 可 看 作 适 用 于 某 种 具体 关联 的 实体 实例 的 数量 。 通 常 
会 使 用 术语 “ 目 ” 或 “ 度 ” (degree) 而 不 是 基数 。 关 联 的 每 一 方 都 有 与 其 有 关 的 基数 或 目 。 


基数 是 存在 于 一 对 实体 中 的 实例 的 数量 。 


在 最 简单 的 层面 ， 以 E/R 图 所 绘制 的 关联 的 方式 来 表达 基数 。 回 想 一 下 图 3-2 中 显示 的 图 表 技术 ， 基 数 要 么 是 “一 ”， 要 么 
是 “多 ”。 通 过 使 用 Martin 技 术 (图 中 第 三 行 ) ， 基 数 “ 一 ”用 直线 表示 ， 而 基数 “多 ”用 鱼 尾 线 表示 。 


在 更 复杂 的 层面 ， 数 据 模 型 应 涵盖 每 种 关联 的 具体 基数 的 更 多 信息 。 一 个 完整 的 数据 模型 ， 将 以 整数 值 记录 关联 的 每 一 方 的 
最 小 和 最 大 基数 。 然 而 ， 此 种 详细 的 基数 信息 无 需 在 图 表 中 体现 ， 尤 其 在 概念 层面 。 


可 选择 性 
数据 模型 还 必须 涵盖 关联 是 强制 的 或 可 选 的 。 这 通常 称 作 此 关联 的 可 选择 性 。 而 关联 的 每 一 方 都 具有 可 选择 性 的 特征 。 
关联 的 每 一 方 都 具有 可 选择 性 的 特征 。 


对 于 Martin 图 表 技术 来 说 ， 在 关联 的 底部 绘制 横 线 代表 此 关联 是 强制 的 ， 而 绘制 小 圈 则 代表 此 关联 可 选 。 请 参阅 图 3-4 中 的 
关联 图 ， 此 数据 模型 片段 清楚 地 表明 EMPLOYEE 是 被 STORE 雇佣 的 。STORE 可 以 有 零 个 、 一 个 或 多 个 EMPLOYEE， 只 要 有 
EMPLOYEE， 那 么 与 STORE 的 关联 就 是 强制 的 。 并 且 ， 一 个 EMPLOYEE 只 可 以 为 一 个 商家 工作 。 


EMPLOYEE 


EmployeeNum 


Name 


STORE 


Address 
Phone Manager 
SSNum Address 


Salary 
Supervisor 


图 3-4 ”数据 模型 片段 
其 他 的 图 表 技术 使 用 了 不 同 的 方法 ,或 者 形状 不 同 ， 或 者 使 用 了 具体 的 整数 值 。 


由 此 可 以 看 出 ,使 用 了 定义 良好 的 图 表 技术 和 符号 的 图 形 化 数据 模型 ， 可 以 清楚 地 表达 数据 的 业务 需求 。 通 过 掌握 数据 建 模 
技术 ， 一 个 对 业务 并 不 熟悉 的 人 可 以 快速 学 会 并 沟通 企业 的 基本 业务 规则 。 


3.3 ”上 友 现 实体 、 属 性 和 天 联 


从 非常 高 的 层面 来 讲 ， 数 据 建 模 的 过 程 可 以 看 作 实 体 及 其 属性 ， 与 实体 间 的 关联 的 发 现 过 程 。 针 对 某 项 业务 而 对 这 些 项 进行 
的 发 现 和 记录 的 过 程 就 是 数据 建 模 。 现 在 ， 听 起 来 数据 建 模 可 能 比较 简单 ， 但 它 需 要 通过 实践 来 学 习 如 何 倾听 商务 演讲 ， 识 别 并 
区 分 实体 、 属 性 和 关联 。 


关注 商务 专家 所 使 用 的 名 词 、 名 词 短语 、 动 词 和 形容 词 。 


第 一 个 技巧 就 是 要 关注 商务 专家 所 使 用 的 名 词 、 名 词 短语 、 动 词 和 形容 词 。 名 词 可 能 是 实体 和 属性 ， 或 者 实体 实例 和 属性 
值 。 形 容 词 和 介词 短语 通常 是 属性 。 动 词 则 表示 关联 。 


当然 ， 制 定数 据 模 型 不 仅 要 倾听 名 词 、 形 容 词 等 ， 还 要 将 它们 与 实体 、 属 性 和 数据 模型 的 天 联 对 号 入 座 。 名 词 不 一 定 就 是 实 
体 ， 形 容 词 、 动 词 、 介 词 短语 同 理 。 需 要 经 验 来 过 滤 那 些 商务 演讲 ， 从 而 可 以 识别 正确 的 实体 、 属 性 和 关联 。 

分 析 演 讲 时 ， 不 要 脱离 语 境 ， 并 通过 提问 来 和 弄 清楚 某 个 名 词 到 底 是 实体 还 是 属性 。 记 住 ， 属 性 识别 、 叙 述 或 描述 实体 。 而 实 
体 是 最 重要 和 最 普遍 的 事物 ， 商 务 专家 将 讨论 人 、 地 点 、 事 物 、 概 念 和 对 业务 有 益 的 事件 。 


通常 那些 专家 使 用 的 术语 并 不 适用 于 数据 模型 ， 你 需要 将 它们 进行 概括 和 抽象 。 例 如 ， 他 们 会 与 公司 做 生意 ， 但 生意 也 可 与 
个 人 进行 。 在 数据 模型 中 ， 你 可 能 需要 创建 抽象 的 实体 PARTY， 或 者 一 些 其 他 的 抽象 实体 ， 包 含 公司 、 其 他 类 型 的 企业 和 个 
人 。 


没有 哪个 人 知道 企业 所 有 的 数据 需求 。 


创建 数据 模型 时 ， 一 定 要 征求 各 方面 的 意见 。 基 于 某 个 专家 的 建议 而 搭建 的 数据 模型 肯定 是 不 准确 的 。 想 想 盲 人 摸 象 的 故事 
吧 ， 没 有 哪个 人 知道 企业 (或 企业 的 某 一 部 分 ) 所 有 的 数据 需求 。 在 多 次 与 多 个 专家 的 探讨 过 程 中 ， 数 据 的 实质 和 定义 将 会 变 得 


需要 记 住 的 是 ， 数 据 模型 的 模式 往往 会 重复 。 从 事 数据 建 模 项 目 时 ， 你 可 能 会 注意 到 一 些 模式 在 多 个 学 科 领 域 重 复出 现 。 学 
着 了 解 这 些 模式 或 许可 以 简化 数据 模型 的 创建 过 程 。 但 要 切记 ， 在 没有 咨询 商务 专家 的 情况 下 ， 不 要 一 头 扎 进 某 种 模式 。 因 为 有 
时 某 个 模式 看 起 来 似曾相识 ， 其 实 却 是 全 新 的 。 


与 大 多 数 事情 一 样 ， 实 践 出 真知 ， 数 据 建 模 也 一 样 。 如 果 在 初步 尝试 建立 数据 模型 时 遇 到 困难 或 错误 百出 ， 不 要 气 外 。 尝 试 
越 多 ， 做 得 就 越 好 。 


最 后 ， 为 了 进一步 阐明 数据 建 模 的 灵活 性 和 实用 性 ， 看 一 个 数据 模型 ， 它 结合 了 刚刚 了 解 的 数据 建 模 知 识 。E/R 图 3-5 清 楚 
地 表明 了 数据 模型 各 个 分 量 之 间 的 关联 。 


实体 
属性 和 一 一 一 一 一 


属性 的 值 


图 3-5 ”数据 建 模 各 方面 的 关联 


3.4 概念、 逻辑 和 物理 数据 模型 


到 现在 已 经 讨论 了 通常 所 讲 的 数据 模型 。 但 实际 上 有 三 种 类 型 的 数据 模型 : 概念 、 逻 辑 和 物理 。 


概念 和 地 辑 都 是 描述 数据 建 模 不 同 阶段 的 松散 术语 。 概 念 数据 模型 与 完整 的 逻辑 数据 模型 相 比 ， 通 常 更 抽象 且 不 详细 。 两 者 
之 间 没 有 明确 的 分 界线 ， 但 以 下 论述 在 很 大 程度 上 是 建 模 界 所 接受 的 。 


概念 数据 模型 描述 了 一 种 高 水 平 的 、 面 向 业务 的 信息 视图 。 为 了 强调 最 重要 的 实体 、 属 性 和 关联 ， 该 模型 舍弃 了 一 些 非 关键 
性 的 细节 。 概 念 数据 模型 可 能 包含 多 对 多 的 关联 。 概 念 建 模 的 终极 目标 是 简单 明了 ， 因 此 ， 没 必要 发 现 并 记录 各 实体 的 每 一 个 属 
性 。 此 外 ， 一 些 问 题 如 基数 、 可 选择 性 和 数据 类 型 在 概念 层面 上 也 可 以 不 予 考虑 。 一 些 简单 的 候选 码 可 能 被 记录 下 来 ， 但 概念 数 
据 模 型 对 多 数 的 码 无 法 识别 ， 因 为 高 度 抽 象 化 使 得 原本 有 效 的 码 标识 变 得 不 切实 际 也 不 大 可 能 。 该 模型 中 的 关联 是 不 需要 命名 
的 ， 因 为 其 终极 目标 是 高 度 简单 化 ， 如 果 关 联名 称 使 数据 模型 图 变 得 杂乱 ， 这 就 与 其 目标 相 违 背 了 。 


概念 数据 模型 描述 了 一 种 高 水 平 的 、 面 向 业务 的 信息 视图 。 


逻辑 数据 模型 由 完全 规范 化 的 、 定 义 了 全 部 属性 的 实体 组 成 。 此 外 ， 各 个 属性 的 域 或 者 数据 类 型 必须 定义 。 逻 辑 数 据 模 型 需 
要 规范 的 候选 码 来 唯一 标识 实体 的 每 一 个 实例 。 对 于 有 多 个 候选 码 的 实体 ， 逻 辑 数据 模型 必须 注 明 哪个 候选 码 用 作 标识 ， 即 主 
码 。 外 码 的 定义 应 清晰 或 由 数据 天 联 暗示 。 多 对 多 的 关联 应 翻译 成 中 间 实 体 ( 详 见 “中 间 实 体 ”) ， 这 可 能 会 获得 额外 的 属性 或 


标识 符 。 在 逻辑 数据 模型 中 ， 其 他 细节 (如 基数 和 关联 是 可 选 或 必 选 的 ) 都 必须 记录 下 来 。 所 有 的 关联 的 命名 也 应 清晰 且 明 确 。 
逻辑 数据 模型 应 可 以 作为 开发 物理 数据 库 的 完整 文档 。 

逻辑 数据 模型 提供 了 一 个 全 面 的 形式 结构 来 作为 业务 数据 的 蓝图 。 

创建 物理 数据 模型 是 为 了 通过 使 用 具体 的 DBMS 产 品 (如 DB2、Oracle 或 SQL Server) ， 将 逻辑 数据 模型 转化 成 物理 实 
现 。 有 关 物 理 数 据 模 型 的 详细 介绍 请 参考 第 4 章 。 

物理 数据 模型 通过 具体 的 DBMS 产 品 将 逻辑 数据 模型 转化 成 物理 实现 。 

中 间 实 体 

如 果 需 要 ， 中 间 实 体 可 以 提供 关联 的 额外 信息 。 换 句 话 说， 中间 实体 将 属性 与 关联 联系 在 一 起 。 中 间 实 体 还 使 多 对 多 的 关联 

通过 关系 数据 库 实 现 变 得 可 能 。 


每 个 多 对 多 关联 都 可 以 分 解 为 处 于 两 个 既 有 实体 间 的 一 对 多 关联 对 ， 和 一 个 新 实体 〈 即 中 间 实 体 ) ， 如 图 3-6 所 示 。 


STUDENT 


StudentiD 


LastName 
FirstName 
Middlelnit 

MajoriD 


COURSE 


CourseNum 


CourseName 
Credits 


STUDENT 
Tere ENROLLMENT COURSE 
FirstName StudentID 
Middlelnit Er CourseName 


Credits 


MajorlD | CourseCompDate 


图 3-6 ”从 多 对 多 到 中 间 实 体 


一 名 STUDENT 可 以 注册 多 门 COURSE， 且 每 门 COURSE 可 以 容纳 多 名 STUDENT。 这 个 典型 的 多 对 多 关联 可 以 分 解 为 如 图 3- 
6 所 示 的 形式 。 此 时 创建 了 一 个 新 的 中 间 实 体 ENROLLMENT。 先 前 存在 的 各 实体 的 主 码 复制 到 该 新 实体 中 ， 且 原来 的 多 对 多 关 
联 被 两 个 一 对 多 关联 取代 ， 大 多 数 情况 下 ，“ 多 ”的 一 方 都 在 新 的 中 间 实 体 。 现 在 ， 属 性 可 以 分 配给 新 的 实体 了 ， 这 对 于 关联 来 


说 原本 是 不 可 能 的 。 


因此 ， 概 念 数据 模型 侧重 于 通过 真实 世界 的 视角 来 看 待 特 殊 的 业务 主题 ， 它 使 抽象 理解 业务 变 得 更 容易 。 逻 辑 数据 模型 提供 
全 面 的 形式 结构 ， 可 用 作业 务 数 据 的 蓝图 以 及 数据 库 的 定义 。 物 理 数 据 模型 明确 地 说 明了 逻辑 数据 模型 是 如 何 通 过 特定 的 DBMS 
实现 的 。 


3.5 ”什么 是 规范 化 
简单 来 说 ， 规 范 化 (normalization) 是 一 种 设计 方式 ， 它 可 以 最 大 程度 地 减少 数据 有 见 余 ， 并 通过 妥善 将 数据 元 素 放置 到 适 
当 的 分 组 来 达到 优化 数据 结构 的 目的 。 规 范 化 的 数据 模型 可 以 转化 成 组 织 正 确 的 物理 数据 库 。 


规范 化 由 关系 模型 之 父 Dr.E.F.Codd 在 20 世 纪 70 年 代 创 建 。 与 数据 的 关系 模型 一 样 ， 规 范 化 也 是 基于 集合 论 的 数学 原理 。 尽 
管 规范 化 由 关系 理论 演变 而 来 ， 但 是 规范 数据 的 过 程 一 般 适用 于 任何 类 型 的 数据 。 


重要 的 是 ， 规 范 化 是 个 逻辑 过 程 ， 它 并 不 能 决定 物理 数据 库 的 设计 。 规 范 化 的 数据 模型 将 确保 每 个 实体 都 是 完整 的 ， 且 每 个 
属性 都 分 配给 了 适当 的 实体 。 当 然 ， 理 想 情 况 是 规范 化 的 逻辑 数据 模型 可 以 真正 地 实现 且 没 有 较 大 的 改动 。 然 而 ， 正 如 将 在 第 4 
章 看 到 的 一 样 ， 由 于 物理 实现 的 需求 和 DBMS 产 品 的 缺乏 ， 有 时 物理 数据 库 必须 不 同 于 逻辑 数据 模型 。 


3.6 $ext 


正如 前 面 所 提 ，Dr.Codd 首 先 描 述 了 数据 规范 化 。 他 在 1971 年 和 1972 年 发 表 了 几 篇 论文 来 描述 前 三 种 范式 。 后 来 Codd 和 其 
他 人 定义 了 额外 的 范式 。 


3.6.1 一 范式 

第 一 范式 (NF) 的 目标 是 去 除 实 体 中 的 重复 分 组 和 非 原子 数据 。 数 据 符合 1NF 时 ， 实 体 的 每 个 属性 都 是 离散 的 ( 换 句 话 
说 ， 都 是 原子 的 ) 。 术 语 atomic 由 atom 演 变 而 来 ， 是 指 可 以 独自 存在 的 、 不 可 分 割 的 最 小 粒子 。 

第 一 范式 去 除 实体 中 的 重复 分 组 和 非 原子 数据 。 

Oey 当 是 仅 当 数据 表 的 所 有 列 只 包含 原子 值 时 ， 即 满足 第 一 范式 。 


要 想 使 数据 模型 符合 1INF， 必 须 将 重复 的 分 组 分 裂 成 单个 实体 以 消除 分 组 。 换 名 话说， 在 单个 实体 中 不 要 使 用 多 个 属性 来 存 
储 相似 的 数据 。 表 3-2 的 示例 数据 显示 了 某 大 学 的 STUDENT 信息 系统 。 


表 3-2 “ 非 规范 化 的 STUDENT 数据 


StudentID StudentName MajorID | StudentMajor | CourseNum CourseCompDate 
MATOO11 离散 数学 2012-08-01 
2907 Smith.Jacob R Mat MAT0027 微 积 分 I 2012-04-30 
EGL0010 英语 经 典 I 2011-12-30 
PHI0010 2012-04-30 
4019 Patterson,Jane K PHI n+ ee 
CS00100 编程 语言 2012-04-30 
5145 |NeeldNorrisB 语文 学 SOC0102 人 的 上 升 2012-08-01 
| | oo MUS0002 Be AY i WR 2012-04-30 
6132 Morrison, VavierQ MUS TZR T 
SOC0102 人 的 上 升 2012-08-01 
7810 Brown, Richard E j Pe 
EGL 


EGL0010 英语 经 典 I 2011-12-30 
8966 Juarez,Samantha 


EGLO0101 WE EME II 2012-08-01 


该 数据 多 处 违反 了 1NF。 首 先 ， 课 程 在 STUDENT 中 确实 是 重复 的 ， 因 此 ， 课 程 信息 应 转移 到 独立 的 实体 。 此 外 ， 要 为 所 有 
的 实体 都 指定 标识 符 。 标 识 符 是 实体 的 主 码 。 


谨慎 地 为 各 实体 选择 合适 的 主 码 。 这 可 能 比较 棘手 ， 最 先 想 到 的 可 能 是 选择 CourseNum 作 为 COURSE 实 体 的 主 码 。 但 就 该 
数据 的 情况 来 看 ， 还 需要 更 多 的 信息 来 识别 课程 信息 。 课 程 完成 日 期 可 用 于 STUDENT 和 COURSE 的 组 合 ， 即 除非 有 学 生 参 加 并 
修 完了 该 课程 ， 这 门 课程 才 算 完成 。 


第 二 个 违背 1NF 的 地 方 是 ， 属 性 StudentName 中 包含 了 非 原子 数据 。 学 生 的 姓名 可 以 分 解 为 : 名 、 中 间 名 和 姓 。 由 于 可 以 
分 割 ， 因 此 违背 了 第 一 范式 。1NF 的 最 终结 果 见 表 3-3 和 表 3-4。 


表 3-3 满足 1NE 的 实体 STUDENT 


表 3-4 满足 1NE 的 实体 COURSE 


StudentID CourseCompDate 
2907 离散 数学 2012-08-01 
2907 是 语 经 典 I 2011-12-30 
4019 哲学 简 2012-04-30 
4019 编程 语言 2012-04-30 


StudentID CourseCompDate 
6132 HERRI 2012-04-30 
8966 英语 经 典 I 2011-12-30 
8966 莎士比亚 I 2012-08-01 


3.6.2 -PB 


第 二 范式 (2NF) 确保 每 个 实体 的 所 有 属性 都 依赖 主 码 。 将 1NF 转 换 成 2NF， 要 为 那些 适用 于 多 条 记录 的 属性 创建 单独 的 实 
体 ， 并 为 该 新 实体 分 配 外 码 使 之 与 原来 的 实体 相关 。 简 单 来 说 ， 实 体 实例 不 应 依赖 除 实体 主 码 以 外 的 任何 东西 。 


第 二 范式 确保 每 个 实体 的 所 有 属性 都 是 依赖 的 。 
Oey 当 且 仅 当 满足 第 一 范式 ， 并 且 每 一 个 非 主 属 性 都 完全 依赖 主 码 时 ， 即 满足 第 二 范式 。 


再 来 看 一 下 表 3-3 和 表 3-4， 实 体 COURSE 中 有 些 课程 是 重复 的 ， 如 “英语 经 典 |” 和 “人 的 上 升 ”， 这 就 违背 了 2NF。 要 解 
决 这 个 问题 ， 需 要 找 出 那些 不 依赖 码 的 属性 ， 将 它们 删除 。 这 些 被 删除 的 属性 ， 连 同 它们 依赖 的 主 码 一 起 放 到 一 个 新 的 实体 
ENROLLMENT 中 。 原 来 实体 的 主 码 则 保留 在 原 实体 中 。 


规范 化 的 另 一 个 好 处 是 ， 你 会 经 常 需要 为 新 创建 的 实体 指定 新 的 属性 。 例 如 ， 也 许 新 的 实体 COURSE 要 为 每 门 课程 分 配 若 干 
学 分 计算 到 毕业 学 分 中 。 因 此 ， 创 建 一 个 新 的 属性 来 存储 每 个 特定 课程 的 学 分 。 当 然 ， 也 可 以 决定 STUDENT 同样 需要 更 多 信 
息 ， 如 地 址 、 电 话 号 码 和 出 生日 期 ， 但 为 了 简单 起 见 ， 暂 时 将 它们 省 略 了 。 


2NF 规 范 化 的 最 终结 果 如 表 3-3 (实体 STUDENT 没有 改变 ) 、 表 3-5 和 表 3-6 所 示 。 
表 3-5 ”满足 2NF 的 实体 ENROLLMENT 


StudentID CourseNum CourseCompDate 
2907 MAT0011 2012-08-01 
2907 MAT0027 2012-04-30 
2907 EGLO0010 2011-12-30 
4019 PHI0010 2012-04-30 
4019 CS00100 2012-04-30 
5145 SOC0102 2012-08-01 
6132 MUS0002 2012-04-30 
6132 SOC0102 2012-08-01 
8966 EGL0010 2011-12-30 
8966 EGLO101 2012-08-01 


403-6 ”满足 2NF 的 实体 COURSE 


CourseNum CourseName Credits 


MAT0011 3 
MAT0027 4 
EGL0010 3 
PHI0010 哲学 简介 3 
CS00100 编程 语言 3 
MUS0002 HEKEI 3 


3.6.3” 第 三 范式 


第 三 范式 (3NF) 确保 实体 的 属性 间 不 存在 关联 ， 该 实体 内 的 每 一 个 属性 都 只 依赖 主 码 。 对 于 满足 第 三 范式 的 数据 模型 有 种 
半 开 玩笑 的 说 法 : 每 个 属性 都 依赖 码 ， 唯 一 的 码 ， 除 了 码 就 没有 别 的 了 ， 噢 ，Codd! 救 救 我 吧 ! 


第 三 范式 确保 实体 的 属性 间 不 存在 关联 。 
Oza 当 且 仅 当 满足 第 二 范式 且 每 一 个 非 主 属性 既 不 依赖 码 也 不 传递 依赖 码 时 ， 即 满足 第 三 范式 。 


一 种 检测 是 否 违背 3NF 的 经 验 法 则 是 : 查看 所 有 的 属性 值 是 否 适 用 于 不 止 一 个 实体 实例 。 如 果 有 这 样 的 属性 ， 将 它们 转移 到 
单独 的 实体 。 


下 面 再 次 看 看 STUDENT 实体 的 信息 ， 是 否 有 违背 3NF 的 情况 。 仔 细 研 究 表 3-3 中 的 STUDENT 数据 ， 发 现 有 的 学 生 选 了 同样 
的 主 修 课 ， 因 此 ， 有 些 主 修 课 的 信息 是 重复 的 。 特 别 是 ， 在 举例 中 竟然 有 两 名 学 生 都 选 了 英语 文学 。 要 解决 这 个 问题 ， 需 要 将 传 
递 依 赖 码 的 主 修 课 这 一 属性 删除 ， 并 为 它 创建 一 个 新 的 实体 。 表 3-7 和 表 3-8 显 示 了 更 正 后 的 数据 ， 满 足 3NF。 


表 3-7 满足 3NF 的 实体 STUDENT 


表 3-8 满足 3NF 的 实体 MAJOR 


MajorlD StudentMajor 
MAT 数学 : 
PHI 哲学 
EGL 英语 文学 
MUS 音乐 


CS 计算 机 科学 


3.6.4 一 个 规范 化 的 数据 模型 


为 了 做 到 完美 ， 应 为 刚才 创建 的 STUDENT 数据 制作 一 张 满足 3NF 数 据 模 型 的 图 表 ， 如 图 3-7 所 示 。 请 注意 ， 我 们 并 没有 填 
写 关联 的 可 选择 性 。 基 于 示例 中 的 数据 可 以 做 到 这 一 点 ， 但 在 回答 “每 名 学 生 都 有 主 修 课 吗 ”” 这 个 问题 之 前 还 有 很 多 问题 需要 
考虑 。 当 前 的 数据 显示 确实 如 此 ， 但 实际 上 ， 大 多 数 新 生 甚至 高 年 级 学 生 可 能 都 没有 参加 正式 的 主 修 课 。 


STUDENT 


MAJOR 


LastName 
FirstName 
Middlelnit 

MajorlD 


ENROLLMENT 


StudentlD 
CourseNum 


CourseCompDate 


COURSE 


CourseNum 


CourseName 
Credits 


图 3-7 STUDENT 数据 模型 


3.6.5 ”进一步 的 范式 


规范 化 并 没有 停留 在 3NF 上 ， 其 他 的 范式 已 经 得 到 大 家 的 认可 并 记录 了 。 但 通常 不 会 有 超过 3NF 的 情况 。 以 下 是 一 些 其 他 的 
范式 。 


通常 不 会 有 超过 3NF 的 情况 。 


. BC 范式 (BCNF) 是 修正 的 3NF。 事 实 上 ， 在 Codd 后 来 的 著作 中 就 将 BCNF 称 作 3NF。 当 且 仅 当 每 一 个 决定 因素 都 是 候选 
码 ， 即 满足 BCNF。 大 多 数 满足 3NF 的 实体 都 满足 BCNF。 


:第 四 范式 (ANF) 指出 如 果 “ 一 对 多 ”的 属性 彼此 独立 ， 就 没有 任何 实体 可 以 有 超过 一 个 “一 对 多 ”的 关联 。 当 且 仅 当 满 
足 3NF 且 没有 多 个 多 值 依赖 时 ， 即 满足 4NF。 


:第 五 范式 (SNF) 指出 实体 的 每 一 个 连接 依赖 必须 是 其 候选 码 的 结果 。 


Oxy 决定 因素 可 以 是 任何 属性 值 ， 它 能 够 决定 实体 实例 中 其 他 属性 值 。 


3.7” 规 汇 化 实践 


当 数 据 模 型 从 概念 层 转 到 逻辑 层 时 ， 应 对 其 进行 规 汉化 。 这 样 就 为 数据 库 的 最 佳 设 计 创 建 了 一 张 数据 蓝图 。 
规范 化 是 一 个 合乎 逻辑 的 过 程 。 
但 要 记 住 ,规范 化 是 一 个 合乎 逻辑 的 过 程 。 有些 时 人 息 ， 数 据 建 模 师 尝 试 直接 按照 逻辑 模型 进行 物理 数据 库 的 设计 。 但 强迫 


DBA 和 技术 人 员 放 弃 物 理 设计 是 不 明智 的 。 最 理想 的 情况 是 ， 一 对 一 的 逻辑 到 物理 的 转换 会 成 功 ， 但 有 多 种 原因 致使 这 种 严格 
一 对 一 的 映射 是 不 实际 的 。 第 4 章 将 详细 讨论 这 些 原因 ，。 


关系 需要 1NF 


部 署 关 系数 据 库 的 数据 模型 绝对 需要 的 唯一 范式 是 INF。1NF 确 保 了 表格 数据 。 当 然 ， 对 于 关系 数据 库 来 说 ， 进 一 步 规范 化 
成 3NF 将 更 方便 管理 和 维护 数据 的 完整 性 ， 但 3NF 不 是 关系 数据 库 部 署 的 硬性 要 求 。 


3.8” 其 他 数据 建 模 问题 


请 记 住 ， 本 章 的 目的 是 为 DBA 广 泛 地 概述 数据 建 模 的 概念 。 在 那些 真正 将 数据 视 作 企业 资产 的 企业 里 ， 数 据 建 模 可 以 是 全 
职工 作 的 。 本 章 的 内 容 应 该 足以 让 DBA 在 创建 数据 库 之 前 首先 创建 合适 的 数据 模型 。 然 而 ， 企 业 进 行 数据 库 管理 将 需要 解决 更 
高 级 的 数据 建 模 问题 ， 如 下 : 


- 子 类 型 该 如 何 处 理 ? 当 单 个 实体 的 属性 仅 适 用 于 某 些 实体 实例 时 ， 子 类 型 才 可 以 创建 。 例 如 ，PART-TIME EMPLOYEE 
和 FULL-TIME EMPLOYEE 可 以 是 EMPLOYEE 这 个 父 类 型 实体 的 子 类 型 。 如 果子 类 型 存在 不 同 的 关联 或 有 足够 数量 的 属性 仅 适 
用 于 一 个 子 类 型 时 ， 子 类 型 才 是 必需 的 。 


+ 逻辑 数据 模型 如 何 对 待 派生 数据 ? 如 果 从 其 他 数据 派生 而 来 ， 还 有 必要 建 模 或 记录 吗 ? 


. 域 应 在 何 时 成 为 实体 ? 例如 ， 美 国 的 业务 用 户 通常 都 知道 各 州 的 缩写 ， 因 此 ， 一 般 不 需要 创建 实体 作为 州 的 名 字 及 其 缩写 
的 映射 。 但 并 非 所 有 的 决定 都 如 此 简单 。 


: 如 果 时 间 是 数据 的 一 个 决定 性 因素 ， 在 数据 模型 中 该 如 何 处 理 呢 ? 例如 ， 或 许 一 名 CUSTOMER 一 次 只 能 购买 一 个 
BASKET 的 货物 ， 但 随 着 时 间 的 推移 ， 该 CUSTOMER 会 购买 许多 BASKET 的 货物 ， 因 为 每 次 都 会 购买 一 个 新 的 BASKET 的 货物 。 


. 什么 时 候 多 许 有 一 对 一 的 关联 ? 处 于 一 对 一 关联 中 的 实体 可 以 更 好 地 收缩 到 一 个 实体 中 ， 但 其 他 问题 如 其 他 实体 之 间 的 关 
联 可 能 就 不 适用 该 做 法 。 


在 以 数据 为 中 心 的 先进 企业 中 ， 这 些 问题 与 其 他 可 能 出 现 的 问题 都 需要 数据 建 模 师 和 DA 去 研究 和 学 习 。 


3.9 We 


数据 建 模 和 规 学 化 为 数据 库 设 计 提 供 了 基础 。 数 据 建 模 是 一 种 分 析 企 业 感 兴趣 的 事物 及 其 如 何 彼此 关联 的 实践 过 程 。 此 外 ， 
其 产物 数据 模型 可 用 作 商 业 数 据 需求 的 蓝图 


对 于 要 进行 规范 化 的 数据 ， 每 个 实体 必须 具有 一 个 主 码 标识 。 每 个 实体 的 所 有 属性 都 必须 是 原子 的 、 不 可 分 割 的 ， 且 不 是 重 
复 组 的 一 部 分 。 此 外 ， 每 个 实体 的 属性 都 只 适用 于 该 实体 ， 且 只 依赖 该 实体 的 完整 主 码 。 


规范 化 数据 时 ， 事 实 按照 合乎 逻辑 的 实体 进行 分 组 。 没 有 哪个 事实 与 错误 的 实体 有 关 。 主 码 完 完全 全 表示 各 实体 实例 的 每 一 
个 属性 的 值 。 换 名 话说， 规范 化 的 数据 模型 才 是 一 个 正确 的 数据 蓝图 


接 下 来 要 做 的 就 是 基于 逻辑 数据 模型 来 部 署 物理 数据 库 。 要 做 到 这 一 点 ， 需 要 对 使 用 的 DBMS 以 及 DBMS 和 数据 库 的 基础 知 
识 有 全 面 透彻 的 理解 。 


3.10 ”回顾 


1. 概 念 数据 模型 与 逻辑 数据 模型 的 区 别 是 什么 ? 

2. 为 什么 说 数据 建 模 对 数据 库 开发 很 重要 ? 

3. 描 述 实体 和 属性 的 合适 的 命名 指南 。 

4. 就 规范 化 的 目标 ， 给 出 大 概 的 描述 。 

5. 实 体 与 实体 实例 的 区 别 是 什么 ? 

6. 查 看 表 3-9 并 和 解释 所 显示 的 数据 违背 了 1NF 的 原因 。 

7. 属 性 LastrName 作 为 实体 CUSTOMER 的 主 码 是 一 个 好 的 选择 吗 ? 为 什么 是 ? 为 什么 不 是 ? 请 详细 说 明 .。 
8. 如 何 指定 两 个 实体 之 间 的 关联? 

9. 每 个 属性 要 做 三 件 事 情 中 的 一 件 ， 说 出 这 些 事情 的 名 称 并 描述 。 

10. 标 识 实体 实例 的 属性 或 属性 集 叫 作 什 么 ? 


表 3-9 示例 数据 


附加 问题 


阅读 以 下 段落 并 为 讨论 中 的 业务 创建 一 个 数据 模型 。 


我 和 我 的 搭档 拥有 一 家 独立 的 唱片 店 。 好 吧 ， 我 猜 目前 唱片 店 确实 是 个 错误 的 选择 ， 因 为 我 们 真 的 没 卖 出 去 多 少 唱片 。 我 们 
主要 出 售 CD， 还 有 一 些 磁 带 。 哦 ， 是 的 ， 我 们 也 存 有 一 些 黑 胶 喝 片 。 无 论 形式 〈 即 CD、 磁 带 或 唱片) ， 我 们 出 售 的 有 专辑 也 有 
单 曲 。 出 售 的 每 件 东西 都 有 标价 ， 并 且 每 天 都 会 记录 每 种 唱片 的 库存 。 我 们 习惯 通过 记录 标题 和 艺术 家 来 跟踪 销售 额 。 销 售 信息 
的 标题 每 周 都 需要 核算 并 发 给 外 部 的 评级 服务 机 构 ， 以 便 他 们 能 够 制作 最 畅销 唱片 的 图 表 。 经 常 有 客户 让 我 们 帮 他 们 找 出 菜 些 歌 
曲 。 这 对 于 单 曲 来 说 比较 简单 ， 因 为 单 曲 的 标题 就 是 歌曲 的 标题 ， 尽 管 有 些 单 曲 唱片 中 也 有 多 首 歌 曲 。 另 一 方面 ， 专 辑 包含 多 首 
歌曲 。 因 此 我 们 需要 做 到 按照 歌曲 的 标题 进行 搜索 ， 让 客户 知道 哪些 唱片 标题 〈 单 曲 和 专辑 ) 包含 他 们 寻找 的 歌曲 。 
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第 4 章 ”数据 库 设 计 


数据 库 设 计 是 一 个 将 逻辑 数据 模型 转换 成 物理 数据 库 ， 然 后 将 物理 模型 实施 为 真正 的 数据 库 的 过 程 。 更 确切 地 说 ， 数 据 库 设 
计 需 要 前 期 的 数据 建 模 和 规范 化 〈 见 第 3 章 的 介绍 ) 。 甚 至 在 你 开始 设计 物理 数据 库 之 前 ， 就 需要 逻辑 数据 模型 。 本 章 假设 逻辑 
数据 模型 是 完整 的 。 因 此 ， 讨 论 的 焦点 将 是 从 逻辑 数据 模型 创建 物理 数据 库 。 


4.1 ”从 逻辑 模型 到 物理 数据 库 


物理 数据 模型 的 创建 是 通过 将 逻辑 数据 模型 转换 成 基于 数据 库 管 理 系统 并 可 用 于 调配 的 物理 实现 。 要 成 功 地 创建 一 个 物理 数 
据 库 设计 ， 你 需要 在 工作 中 了 解 DBMS 的 各 种 功能 ， 包 括 : 


- 深入 了 解 DBMS 支 持 的 数据 库 对 象 、 物 理 结 构 和 支持 这 些 对 象 所 需 的 文件 。 
. 有 关 DBMS 以 何 种 方式 支持 索引 、 参 照 完整 性 、 约 束 条 、 数 据 类 型 以 及 其 他 功能 ， 增 强 数 据 库 对 象 的 功能 。 
详细 了 解 特定 版 本 或 现 有 DBMS 版 本 的 新 的 和 过 时 的 功能 。 
了 解 DBMS 的 配置 参数 。 
+ 将 物理 设计 翻译 成 实际 数据 库 对 象 的 数据 定义 语言 (DDL) 技能 。 

通过 将 逻辑 数据 模型 转换 为 物理 实现 来 创建 物理 数据 模型 。 


有 了 正确 的 信息 ， 你 可 以 根据 逻辑 数据 模型 建立 有 效 且 高 效 的 数据 库 。 将 逻辑 数据 模型 转换 为 物理 模型 的 第 一 步 是 执行 从 逻 
辑 到 物理 对 象 的 一 个 简单 翻译 。 当 然 ， 这 个 简单 的 转换 不 会 导致 一 个 完整 的 、 正 确 的 物理 数据 库 设计 ， 它 只 是 第 一 步 。 下 面 一 步 
一 步 地 解决 转换 。 


4.1.1 实体 转换 成 表 


实体 的 物理 副本 是 一 个 表 。 因 此 ， 从 逻辑 数据 模型 到 物理 数据 库 的 第 一 步 是 数据 模型 中 的 每 个 实体 映射 到 数据 库 中 的 一 个 
表 。 你 最 终 实现 的 数据 库 ， 不 需要 坚持 这 种 严格 的 一 对 一 实体 到 表 的 上 映射。 例如， 为 了 性 能 需要 ， 你 可 能 需要 巩固 或 拆 分 表 ( 非 
规范 化 过 程 ) 。 非 规范 化 将 在 本 章 后 面 详细 介绍 。 


数据 模型 中 的 每 个 实体 映射 到 数据 库 中 的 一 个 表 。 


但 是 ,在 一 般 情况 下 ， 不 要 偏离 最 初 为 逻辑 数据 模型 中 的 每 个 实体 创建 一 个 表 的 简单 规划。 人 逻辑 数据 模型 代表 商业 中 的 “ 东 
西 ” 的 利益 。 在 数据 建 模 过 程 中 ， 这 些 东西 被 分 析 和 设计 为 实体 ， 每 个 实体 的 存在 具有 特定 的 身份 和 目的 。 偏 离 这 个 过 程 的 唯一 
理由 是 : 应 用 程序 的 性 能 或 数据 可 用 性 不 变 就 不 能 接受 。 


4.1.2 ”属性 转换 成 列 


属性 的 物理 副本 是 表 中 的 列 。 当 实体 映射 到 表 ， 每 个 实体 的 属性 映射 到 每 个 相应 的 表 的 列 。 至 少 在 初期 ， 不 改变 列 的 基本 定 


义 。 例 如 ， 不 要 将 属性 汇集 成 一 个 复合 列 。 
每 个 实体 的 属性 应 该 映射 到 每 个 相应 的 表 的 列 。 


物理 列 用 于 逻辑 属性 名 字 时 ， 尽 量 保持 相同 的 命名 约定 。 但 是 ， 你 必须 了 解 的 是 ， 正 在 使 用 的 数据 库 管理 系统 的 物理 限制 可 
能 会 限制 你 这 样 做 。 始 终 记 住 从 逻辑 数据 模型 创建 物理 数据 库 时 DBMS 的 功能 和 局 限 性 。 


域 转换 成 数据 类 型 


为 了 支持 属性 映射 到 表 列 ， 需 要 将 每 个 逻辑 域 的 属性 映射 到 一 个 物理 的 数据 类 型 ,或 许 还 有 额外 的 约束 。 每 一 列 都 必须 分 配 
一 个 数据 类 型 。 某 些 数据 类 型 要 求 你 指定 的 最 大 长 度 。 例 如 ， 你 可 以 指定 一 个 字符 数据 类 型 为 CHAR (20) ， 表 明 可 以 存储 最 多 
20 个 字符 的 列 。 其 他 数据 类 型 ， 如 图 形 、 浮 点 、 十 进 制 (这 也 需要 一 个 规模 ) ， 可 能 需要 采用 一 个 长 度 。 


每 个 逻辑 域 映 射 到 一 个 物理 数据 类 型 ， 或 许 还 有 额外 的 约束 。 


商业 DBMS 产 品 不 支持 域 ， 域 分 配 在 逻辑 数据 模型 必须 映射 到 由 DBMS 支 持 的 数据 类 型 。 可 能 需要 调整 你 使 用 的 数据 库 管理 
系统 的 基础 上 的 数据 类 型 。 例 如 ， 如 果 不 存在 内 置 的 货币 数据 类 型 ， 可 以 将 什么 样 的 数据 类 型 和 长 度 将 用 于 货币 价值 ? 许多 主要 
的 DBMS 产 品 支 持 用 户 自 定义 数据 类 型 ， 所 以 没有 内 置 的 数据 类 型 是 可 以 接受 的 ， 你 可 能 要 考虑 创建 一 个 数据 类 型 支持 的 逻辑 
域 。 


可 能 有 多 个 物理 数据 类 型 ， 可 以 成 功 地 用 于 一 个 域 。 考 虑 的 逻辑 的 有 效 值 为 1 到 10 之 间 的 整数 。 你 可 以 选择 一 个 整数 数据 类 
型 ， 其 中 可 能 有 几 个 (例如 ，BIGINT、INTEGER、SMALLINT、TINYINT) 。 或 者 ， 你 可 以 选择 零 规 模 十 进 制 数据 类 型 。 如 果 
没有 数学 运算 ， 你 甚至 可 能 会 选择 将 数据 存储 在 一 个 2 字 节 的 字符 列 。 这 些 都 可 以 工作 。 作 为 一 个 DBA， 你 需要 确定 哪些 数据 类 
型 可 以 最 有 效 地 访问 、 存 储 、 维 护 、 处 理 访问 数据 的 应 用 程序 。 要 做 出 这 样 的 决定 ， 需 要 深入 的 技术 知识 的 方式 : 如 你 的 DBMS 
物理 存储 每 种 类 型 的 数据 ， 以 及 知识 的 应 用 处 理 细节 。 不 应 该 贸然 定义 数据 类 型 。 不 合适 的 数据 类 型 可 能 会 对 存储 空间 和 磁盘 
MO 方面 产生 影响 。 

除了 一 个 数据 类 型 和 长 度 ， 你 可 能 还 需要 对 列 进行 一 些 约束 。 再 次 考虑 域 1 到 10 的 整数 。 简 单 分 配 物 理 列 到 整数 数据 类 型 是 


不 足以 与 域 相 匹 配 的 。 必 须 添加 约束 限制 ， 可 以 存储 到 指定 的 取 值 范围 为 1~10 的 列 的 值 。 没 有 约束 ， 负 数 、 零 和 大 于 10 的 值 都 
可 被 存储 。 使 用 检查 约束 ， 你 可 以 在 列 或 组 列 放置 可 存储 的 数据 值 限 制 。 检 查 约束 在 第 13 章 中 有 详细 介绍 。 


还 必须 指定 表 中 的 每 个 列 为 空 。 逻 辑 数据 模型 应 包含 每 个 属性 为 空 的 信息 ， 并 且 这 些 信息 可 以 为 每 个 所 需 的 物理 数据 库 中 的 
列 进行 复制 。 某 些 DBMS 软 件 ， 要 插入 一 排 但 不 能 为 列 提供 值 时 ， 使 你 能 够 指定 一 个 默认 值 。 创 建 表 时 ， 你 必须 指定 列 的 默认 
值 。 


指定 每 一 列 的 属性 为 空 。 


对 于 文本 或 字符 数据 ， 你 需要 作出 额外 的 决定 : 列 是 固定 长 度 或 可 变 长 度 ? 固定 长 度 列 占 用 的 存储 量 每 行 一 个 预 设 不 变 。 可 
变 长 度 列 指定 最 大 尺寸 ， 但 是 所 使 用 列 的 实际 长 度 ， 每 一 行 是 可 以 变化 的 。 可 变 长 度 列 可 以 节省 存储 空间 ， 但 通常 需要 由 应 用 程 
序 代码 插入 等 额外 的 操作 和 维护 。 另 外 一 个 不 利 的 方面 是 ， 可 变 长 度 列 可 能 导致 该 表 需 要 更 频繁 的 关注 。 更 改行 大 小 将 对 数据 库 
中 移动 行 有 影响 。 如 果 DBMS 提 供 压 缩 选项 ， 你 可 以 通过 压缩 数据 库 (不 是 调整 可 变 长 度 列 ) 节省 更 多 的 空间 。 
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EBELE EtA. ERRER, MEANE, RENTA 
应 该 是 尝试 使 用 该 主 码 。 然 而 ， 经 常 发 现在 数据 建 模 过 程 中 没有 设计 多 个 候选 码 。 而 在 实际 执行 中 ， 你 可 以 选择 一 个 主 码 为 不 是 


逻辑 设计 时 的 那个 码 一 一 主 码 以 外 的 候选 码 或 其 他 代理 码 。 


如 果 主 码 不 灵活 ， 你 可 能 需要 选择 另 一 个 主 码 。 也 许 该 键 包括 几 个 列 ， 或 者 这 个 键 是 一 个 非 标准 的 数据 类 型 。 在 这 两 种 情况 
下 ， 你 最 好 选择 代理 主 码 。 大 多 数 DBMSs 产 品 提供 了 内 置 的 功能 ， 可 帮助 定义 主 码 。 例 如 支持 默认 值 ，ROWID 数 据 类 型 ， 序 列 
对 象 和 身份 属性 〈( 见 “标识 属性 ”) 。 


大 多 数 DBMS 产 品 提供 了 内 置 功能 ， 以 帮助 定义 主 码 。 


但 是 ， 作 为 一 个 经 验 法 则 ， 一 定 要 为 你 创建 的 每 个 物理 表 确 定 主 码 。 不 这 样 做 ， 表 中 的 数据 处 理 将 更 加 困难 。 如 果 没有 键 来 
唯一 标识 表 中 的 行 ， 具 体 选 择 、 修 改 、 删 除 个 别 行 将 很 困难 。 此 外 ， 如 果 没 有 一 个 主 码 ， 该 表 的 依赖 关系 就 不 能 定义 。 
一 定 要 为 你 创建 的 每 个 物理 表 确定 主 码 。 
当然 ， 也 存在 例外 情况 。 例 如 ， 一 个 表 用 于 记录 或 实施 ， 作 为 一 个 通用 的 队列 可 能 不 需要 一 个 主 码 。 没 有 创建 任何 表 的 主 
B, 虽然 之 前 确保 你 有 一 个 坚实 的 理由 刻意 定义 一 个 独特 的 主 码 是 表 中 没有 的 。 
标识 属性 
标识 属性 是 由 几 个 最 流行 的 相关 数据 库 管理 系统 产品 支持 的 一 项 功能 。 它 可 以 分 配 到 具有 一 个 数值 (通常 为 整数 ) 数据 类 型 


的 一 列 。 当 标识 属性 被 分 配 到 一 列 ，DBMS 以 一 种 特殊 的 方式 对 待 该 列 。 该 数据 库 用 户 不 提供 当 行 插 入 列 所 在 表 时 的 列 值 。 相 
反 ， 在 DBMS 增 加 计数 器 的 计数 ， 并 自动 使 用 该 列 值 。 通 常 每 个 表 只 有 一 列 ， 可 以 分 配 到 标识 属性 。 


标识 属性 为 日 益 增 加 的 顺序 值 填 充 到 相关 表 中 提供 了 有 效 的 途径 。 使 用 此 功能 前 ， 请 确保 你 的 DBMS 支持 标识 属性 ， 你 完全 
理解 功能 如 何 运作 以 及 它 对 功能 和 性 能 上 的 影响 。 例 如 ，DBMS 是 否 提供 了 一 种 方式 ， 逐 表 对 标识 属性 计数 器 进行 重 设 ? 
列 排序 


实现 一 个 物理 表 之 前 ,一 定 要 检查 列 的 顺序 。 从 操作 的 角度 来 说 ， 它 无 须 指 定 列 的 顺序 ， 因 为 不 管 表 中 列 的 顺序 如 
何 ，DBMS 都 将 产生 相同 的 结果 。 然 而 ， 如 何 获得 这 些 结果 的 效率 可 以 相差 很 大 。 列 排序 可 能 会 影响 性 能 ， 因 此 ， 在 实际 操作 
中 ， 你 可 能 需要 更 改 记录 在 逻辑 数据 模型 中 的 顺序 。 


下 面 仔细 看 看 。DBMS 日 志 变化 的 方式 可 能 会 影响 性 能 。 例 如 ，DB2 记 录 了 数据 库 从 第 一 个 字 节 到 最 后 一 个 字 节 的 变化 过 
程 。 唯 一 的 例外 是 可 变 长 度 行 ， 在 这 种 情况 下 ，DB2 记 录 从 第 一 个 字 节 到 该 行 的 未 尾 经 历 的 改变 。 


因此 ， 要 充分 利用 这 方面 关于 DB2 的 物理 实现 的 知识 ， 应 该 基于 DB2 如 何 记录 来 对 列 排 顺 序 。 在 表 的 开头 ， 不 经 常 更 新 的 非 
可 变 列 应 组 合 在 一 起 ， 其 次 是 静态 的 (不 经 常 更 新 的 ) 可 变 列 ， 然 后 频繁 更 新 的 列 。 这 种 结构 将 确保 所 需 的 最 少数 据 量 被 记录 ， 
从 而 加 快 了 任何 数据 修改 进程 。 另 一 个 好 主意 是 将 经 常 修改 的 列 组 合 在 一 起 ， 这 也 可 以 减少 记录 的 数据 量 。 因 为 每 个 DBMS 记 录 
不 同 的 数据 ， 你 需要 了 解 DBMS 如 何 记录 以 及 列 的 顺序 如 何 影响 性 能 。 


413 ”为 所 有 关联 建 引 用 约束 


关联 的 物理 副本 是 引用 约束 。 要 定义 引用 约束 ， 你 必须 为 父 表 创 建 主 码 并 为 从 属 表 创 建 外 码 。 引 用 约束 将 主 码 和 外 码 联 系 起 


引用 约束 将 主 码 和 外 码 联 系 起 来 。 


引用 完整 性 


仅 确 定 表 中 主 码 和 外 码 之 间 的 关联 是 不 够 的 。 每 个 关联 的 功能 在 很 大 程度 上 受到 为 引用 约束 所 选择 的 参数 和 外 码 列 的 值 的 影 
响 。 适 用 于 每 个 关联 的 一 组 规则 决定 了 插入 或 更 新 外 码 列 时 它 的 状态 ， 并 决定 了 删除 主 码 列 时 其 从 属 行 的 状态 。 例 如 ， 主 码 被 删 
除 是 指 现 有 的 外 码 值 ， 规 则 指出 DBMS 是 否 应 忽略 主 码 删 除 ， 也 删除 外 码 的 值 ， 或 将 外 码 值 设置 为 null。 


一 般 情 况 下 ， 外 码 应 该 包含 一 个 外 码 值 域内 的 值 或 为 空 。 任 何其 他 值 都 是 不 可 接受 的 ， 在 操作 过 程 中 ， 引 用 约束 将 导 
DBMS 拒 绝 这 样 的 值 。 引 用 完整 性 (Referential Integrity, RI) ， 保 证 可 接受 的 值 总 是 在 每 个 外 码 列 内 。 


引用 完整 性 保证 可 接受 的 值 总 是 在 每 个 外 码 列 内 。 


对 于 实施 引用 完整 而 言 ， 好 的 物理 设计 实践 是 使 用 数据 库 的 约束 ， 而 不 是 试图 将 完整 性 编 入 应 用 程序 。 不 管 数据 是 通过 一 个 
应 用 程序 以 计划 的 方式 发 生 了 变更 ， 还 是 通过 SQL 语句 或 查询 工具 以 一 种 临时 的 方式 发 生 了 变更 ， 使 用 数据 库 RI 将 保持 该 完整 性 


不 变 。 


当然 ， 每 种 规则 都 有 例外 。 你 应 该 避免 使 用 数据 库 实施 的 RI 约束 情况 ， 包 括 代码 不 经 常 更 改 的 代码 表 和 数据 源 自 引 用 完整 源 
传播 的 数据 仓库 实现 。 基 本 上 RI 不 用 作 执 行 数据 验证 和 编辑 检查 的 替代 品 。 在 检查 约束 中 列 出 的 有 效 值 比 RI 少数 有 效 值 的 静态 数 
据 更 好 。 


第 13 章 将 更 详细 地 介绍 引用 完整 性 。 
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从 逻辑 数据 模型 设计 和 实施 一 个 物理 数据 库 ， 不 只 是 简单 地 将 实体 映射 到 表 ， 属 性 到 列 ， 关 联 到 引用 约束 。 不 少 其 他 数据 库 
设计 的 问题 必须 得 到 解决 。 这 些 问题 之 一 是 准备 数据 的 物理 人 存储。 


虽然 关系 数据 通过 一 个 表 呈 现 给 用 户 ， 但 必须 存在 相关 的 文件 或 数据 集 以 存储 实际 的 数据 ， 这 些 文件 不 必 作 为 行 和 列 的 一 个 
简单 网 格 存储 。 在 物理 设计 过 程 中 ，DBA 必 须 映 射 每 个 表 到 物理 结构 以 存储 表 的 数据 。 这 些 物理 结构 通常 称 为 表 空间 (或 数据 
空间 ) 。 如 图 4-1 所 示 ， 一 个 数据 库 包括 一 个 或 多 个 表 空 间 ， 每 个 表 空间 包含 一 个 或 多 个 表 。 根 据 数据 库 管 理 系 统 ， 一 个 表 也 能 
跨越 多 个 表 空 间 。DBA 可 以 根据 数据 预期 的 使 用 情况 、 表 空间 的 类 型 以 及 DBMS 的 功能 ， 决 定 表 如 何 映射 到 表 空 间 。Microsoft 
SQL Server 使 用 了 一 种 类 似 的 文件 结构 ， 详 细 信 息 请 参阅 “SQL Server 文 件 组 ”。 
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图 4-1 文件 到 数据 库 结 构 的 映射 


额外 的 物理 设计 过 程 是 有 效 规划 存储 和 空间 使 用 情况 。 要 计算 人 存储 一 个 表 所 需 的 存储 量 ，DBA 必 须 首先 建立 行 大 小 。 这 是 
根据 分 配给 它们 的 数据 类 型 和 长 度 ， 通 过 累积 所 有 列 的 最 大 尺寸 来 实现 的 。 平 均 尺 寸 可 以 替换 为 可 变 长 度 列 。 计 划 要 存储 在 表 中 
的 行 的 数量 乘 以 行 大 小 ， 可 以 计算 出 所 需 的 字 节 数 的 估计 值 。 当 然 ，DBA 还 必须 考虑 DBMS 要 求 的 行 标题 、 页 面 标题 、 指 针 等 任 
何 所 需 的 存储 开销 。 因 为 每 个 DBM 使 用 的 技术 不 同 ， 它 们 将 有 不 同 的 开销 要 求 。 

SQL Server 文 件 组 

Microsoft SQL Server 提 供 了 文件 组 ， 将 操作 系统 文件 (包含 来 自 单 一 数据 库 的 数据 ) 组 合 到 一 起 。 通 过 使 用 文件 组 ，DBA 可 
以 简化 某 些 管理 任务 。 文 件 组 是 SQL Servet 数 据 库 的 属性 。 文 件 组 不 能 包含 多 个 数据 库 的 操作 系统 文件 ， 但 一 个 数据 库 可 以 包含 
多 个 文件 组 。 

每 个 数据 库 的 创建 都 基于 一 个 名 为 PRIMARY 的 文件 组 。 创 建 数据 库 后 ， 可 以 添加 额外 的 文件 组 。 如 果 你 的 数据 库 非常 庞大 
而 活跃 ， 可 以 用 多 个 文件 来 提高 性 能 。 

超大 型 的 数据 库 (VLDB) 使 用 SQL Setrver 时 ， 文 件 组 可 将 数据 库 划 分 成 用 于 备份 和 恢复 的 不 同 组 件 。 不 使 用 文件 组 ， 管 理 
VLDB 备 份 和 恢复 很 有 难度 。 

概括 地 说 ， 使 用 SQL Servet 文 件 组 可 以 更 好 地 控制 给 定数 据 库 的 I/O。 

DBA 还 必须 根据 作为 数据 库 服 务 器 正在 使 用 的 操作 系统 来 确定 要 使 用 的 文件 类 型 。 在 某 些 情况 下 ， 不 使 用 操作 系统 文件 系 
统 中 的 数据 库 文 件 可 以 更 高 效 。 这 样 的 文件 有 时 称 为 原始 数据 文件 。 因 为 原始 文件 可 以 防止 操作 系统 开销 ， 对 数据 库 实现 ， 它 往 
往 是 一 个 更 好 的 选择 。 它 需要 从 DBA 得 到 更 多 的 行政 支持 。 


但 是 ， 要 为 数据 库 准备 存储 设备 ，DBA 不 仅 要 确定 表 结构 的 大 小 ， 还 要 确定 索引 结构 的 大 小 。 在 4.2 节 将 深入 地 介绍 索引 。 


DBA 不 仅 要 确定 表 结 构 的 大 小 ， 还 要 确定 索引 结构 的 大 小 。 


DBA 也 将 在 数据 库 设计 中 设置 一 些 可 用 空间 。 当 数据 库 分 配 了 可 用 空间 ，DBMS 可 以 更 有 效 地 添加 数据 ， 并 在 中 断 更 少 的 情 
况 下 进行 重组 和 调整 。 


固态 设备 也 很 有 用 。 将 有 极端 性 能 要 求 的 数据 库存 储 在 固态 设备 ， 而 不 是 磁盘 上 ， 可 以 提高 许多 数据 库 操 作 的 性 能 。 

最 后 一 个 存储 注意 事项 是 是 否 使 用 压缩 。 大 多 数 DBMS 产 品 提供 压缩 数据 的 方法 。 如 果 DBMS 不 提供 压缩 选项 ， 可 以 购买 第 
三 方 压缩 产品 。 有 了 压缩 ， 存 储 相同 的 数据 量 ， 需 要 的 存储 空间 更 少 。 当 添加 数据 到 数据 库 时 ， 压 缩 例 程 将 以 算法 的 形式 对 数据 
进行 压缩 ， 并 在 检索 数据 时 对 数据 进行 解压 缩 。 压 缩 会 增加 CPU 开 销 (11， 因 为 访问 需要 DBMS 压 缩 或 解压 数据 。 然 而 ， 压 缩 可 
能 会 提高 VO 的 效率 : 因为 数据 占用 的 硬盘 空间 更 少 ， 一 次 MO 操作 可 以 读 取 的 数据 就 更 多 了 。 


[1] 一 些 DBMS 产 品 〈 如 DB2 的 z/OS) 提供 硬件 辅助 压缩 ， 可 以 缓解 由 压缩 和 解压 缩 带 来 的 CPU 开销 。 


4.2 数据库 性 能 设计 


当 从 逻辑 数据 模型 实现 一 个 物理 数据 库 ， 必 须 开始 考虑 在 应 用 程序 进行 访问 和 修改 数据 的 请 求 时 ， 数 据 库 将 如 何 执行 。 数 据 
库 处 理 的 一 个 基本 的 事实 是 对 磁盘 的 访问 速度 比 内 存 访问 慢 几 个 数量 级 。 如 果 DBMS 需 要 ， 在 每 一 个 实例 中 ， 通 过 逐 行 或 逐 块 扫 
描 数 据 库 ， 寻 找 所 请 求 的 数据 ， 没 有 人 能 够 用 得 起 数据 库 。 幸 运 的 是 ， 有 几 个 很 好 的 技术 ， 可 以 更 迅速 地 访问 数据 库 中 的 数据 。 


4.2.1 索引 设计 


为 实现 可 接受 的 查询 性 能 最 好 的 技术 之 一 ， 是 对 你 的 数据 库 表 创建 合适 的 索引 。 当 然 ， 关 键 是 在 确定 创建 多 少 索 引 以 及 如 何 
准确 定义 每 个 索引 。 首 先 ， 介 绍 一 些 指数 的 基础 知识 。 


索引 是 数据 库 中 数据 的 备用 路 径 。 索 引 的 结构 使 得 可 以 用 更 少 的 MO 操作 ， 更 容易 地 找到 数据 库 中 的 数据 。 因 此 ， 查 询 使 用 
索引 来 寻找 特定 键 值 的 数据 时 ， 可 以 更 快 地 执行 。 


主要 的 DBMS 产 品 支 持 多 种 类 型 的 索引 。 索 引 可 以 是 唯一 的 或 非 唯一 、 集 群 或 非 集群 、 单 列 或 多 列 。 索 引 的 结构 形式 有 B- 
tree 或 位 图 。 某 些 DBMS 产 品 甚至 支持 散 列 索引 。 然 而 ,每 个 索引 的 基本 目标 是 优化 查询 处 理 。 


索引 是 数据 库 中 数据 的 备用 路 径 。 


在 关系 系统 中 ，DBMS (不 是 程序 员 ) 决定 是 否 使 用 索引 。 因 此 ，DBA 必 须根 据 将 在 数据 库 上 运行 的 查询 类 型 来 设计 索引 。 
DBA 必 须 了 解 关 系 优化 程序 的 操作 ， 并 设计 可 能 用 于 应 用 程序 处 理 的 索引 。 没 有 适当 的 索引 用 于 查询 时 ，DBMS 很 有 可 能 恢复 到 
aie ( 表 中 的 每 一 行将 被 读 取 ， 以 确定 数据 是 否 与 查询 规格 匹配 ) 。 如 果 查 询 目的 不 是 处 理 表 中 的 每 一 行 ， 表 扫描 会 很 昂贵 。 


一 般 情 况 下 ， 尽 量 在 大 表 上 建立 索引 来 支持 执行 频率 很 高 的 查询 。 访 问 小 于 或 等 于 25% 的 表 的 行 的 查询 ， 很 适合 建立 索引 。 
当 超 过 25% 的 表 行 被 选中 时 ， 你 应 该 确定 索引 是 否 比 表 扫描 更 有 效 。 这 将 视 查 询 不 同 而 不 同 ， 视 DBMS 不 同 而 不 同 。 使 用 DBMS 
提供 的 工具 来 确定 索引 的 有 效 性 (SHOWPLAN 或 EXPLAIN 命 令 将 显示 一 个 索引 是 否 用 于 特定 的 查询 ) 。 


此 外 ， 应 该 在 应 用 程序 中 经 常 运行 查询 的 列 上 创建 索引 。 列 在 索引 中 出 现 的 顺序 非常 重要 。 通 过 选择 正确 的 顺序 ， 你 或 许 能 
够 使 某 个 特定 的 索引 适合 许多 其 他 的 查询 。 例 如 ， 如 果 相当 多 的 应 用 程序 查看 ItemType 基 础 上 的 条 目 ， 而 其 他 几 个 查询 查看 
ItemType 和 ItemColor 基 础 上 的 条 目 ， 只 需 一 个 复合 索引 (ItemType, ItemColor) ， 就 能 满足 两 种 查询 类 型 的 需求 。 


在 应 用 程序 中 经 常 运行 查询 的 列 上 创建 索引 。 


一 个 表 可 以 有 多 个 索引 。 计 划 在 每 个 应 用 程序 的 SQL WHERE 和 JOIN 子 句 为 最 常见 的 访问 需求 创建 索引 。 下 列 情况 应 促使 你 
考虑 创建 一 个 索引 : 


- 外 码 : 即使 DBMS 不 要 求 外 码 列 被 索引 ， 这 样 做 也 是 好 的 。 在 外 码 列 上 创建 索引 可 以 根据 两 个 表 的 关联 来 提高 连接 性 能 ， 
但 它 也 可 能 加 快 DBMS 的 内 部 处 理 从 而 强制 参照 完整 性 。 


“ 主 码 : 主 码 列 通常 需要 一 个 索引 ， 以 加 强 其 唯一 性 。 
- 候选 码 : 即使 候选 码 不 需要 索引 ， 如 果 处 理 需 要 根据 候选 码 查找 数据 时 ， 索 引 候选 码 也 是 一 种 好 的 做 法 。 


.唯一 索引 访问 : 如 果 数据 检索 请 求 中 所 有 的 列 都 存在 于 一 个 索引 中 ， 有 可 能 只 使 用 该 索引 就 能 满足 这 一 请 求 。 避 和 免 表 L/O 
可 以 提高 性 能 。 因 此 ， 有 时 一 种 好 的 做 法 是 重 载 索引 列 ， 以 方便 某 些 请 求 的 唯一 索引 访问 。 这 种 索引 有 时 也 叫做 “和 履 盖 索引 ”， 
因为 索引 “ 履 盖 ”了 某 些 查询 所 需 的 所 有 数据 。 此 外 ， 一 些 DBMS 产 品 能 够 向 唯一 索引 添加 列 ， 而 无 需 强制 执行 该 列 的 唯一 性 。 
此 项 技术 可 以 用 来 将 额外 的 列 打 包 进 单个 索引 ， 而 不 需要 多 个 索引 。 


- 排序 : 建立 索引 的 另 一 个 原因 是 尽量 减少 排序 。 使 用 JOIN、ORDER BY, GROUP BY、UNION 和 DISTINCT 等 类 型 的 查 
询 可 能 会 导致 DBMS 对 查询 的 中 间或 最 终 的 结果 进行 排序 。 如 果 创建 索引 来 支持 这 些 功能 ，DBMS 可 以 使 用 索引 进行 排序 ， 而 无 
需 使 用 昂贵 的 排序 算法 。 


DBA 和 性 能 分 析 师 常 犯 的 一 个 错误 是 按照 对 象 索引 ， 而 不 是 按 工 作 量 。 按 对 象 索引 意味 着 创建 表 的 同时 就 要 创建 索引 。 通 
常情 况 下 ， 物 理 数据 库 实施 期 间 ，DBA 将 创建 一 个 数据 库 ， 然 后 是 表 空间 组 和 表 组 。 而 每 一 次 创建 一 个 新 的 表 ，DBA 都 将 尝试 
在 该 表 上 创建 索引 。 这 种 做 法 不 是 最 佳 的 。 


相反 ，DBA 应 该 在 工作 量 的 基础 上 建立 索引 。 索 引 应 该 支持 访问 表 的 SQL 的 谓词 。 建 立 索 引 来 支持 最 常 执行 的 查询 和 最 重要 
的 谓词 查询 ， 应 该 是 建立 支持 主 码 和 唯一 约束 所 需 的 唯一 索引 后 ， 你 的 第 一 个 索引 步骤 。 


当然 ， 这 需要 了 解 如 何 访问 表 。 当 第 一 次 创建 表 时 ， 没 有 任何 SQL。 有 时 可 能 有 潜在 查询 的 含糊 不 清 的 伪 代 码 描述 ， 但 你 不 
知道 确切 的 访问 情景 。 因 此 ， 索 引 是 一 个 增 量 任务 ， 需 在 对 数据 库 进 行 编码 时 持续 执行 。 


当 你 不 断 地 监测 并 建立 新 的 索引 时 ， 请 务必 查看 已 创建 的 旧 索引 。 有 时 候 ， 新 的 索引 可 以 使 现 有 的 索引 过 时 。 好 的 做 法 是 ， 
删除 那些 不 用 于 查询 优化 的 索引 ， 因 为 修改 数据 时 ， 必 须 对 每 一 个 索引 进行 维护 。 这 将 对 数据 库 和 应 用 程序 性 能 产生 负面 影响 。 


为 数据 库 创 建 索 引 模 式 必须 很 小 心 。 一 定 要 分 析 应 用 程序 的 所 有 数据 访问 需求 ， 以 确保 最 佳 的 索引 。 不 了 解 如 何 访问 表 ， 你 
就 无 法 设计 合适 的 索引 。 此 外 ， 你 需要 对 访问 要 求 有 一 个 全 面 的 看 法 。 如 果 某 个 特定 查询 可 以 对 系统 中 其 他 查询 的 性 能 产生 负面 
影响 ， 那 么 索引 是 该 查询 的 最 佳 解决 方案 。 


为 数据 库 创建 索引 模式 必须 很 小 心 。 


此 外 ， 要 注意 索引 不 是 免费 的 。 对 表 中 数据 进行 插入 、 更 新 和 删除 时 ，DBMS 必 须 更 新 索引 。 基 于 这 个 原因 ， 如 果 可 能 ,要 
避免 在 经 常 修改 的 列 上 建立 索引 。 确 保 你 创建 的 每 个 索引 都 有 利于 查询 或 查询 组 的 性 能 ， 而 不 会 显著 降低 访问 数据 库 的 应 用 程序 
的 整体 性 能 。 下 面 是 一 些 在 确定 索引 的 成 本 时 需要 考虑 的 问题 : 


“ 当 插入 和 删除 行 ， 或 索引 列 在 基 表 中 更 新 时 ， 更 新 索引 会 产生 额外 的 开销 。 
. 需要 额外 的 磁盘 空间 来 存储 索引 。 某 些 DBMS 产 品 将 索引 压缩 作为 一 个 选项 。 对 于 非常 大 的 数据 库 ， 索 引 压 缩 是 值得 的 。 


- 对 一 个 有 很 多 索引 的 表 ，LOAD 和 REORG 实 用 程序 可 能 会 运行 很 长 时 间 ， 因 为 在 实用 程序 运行 期 间 也 必须 对 索引 进行 维 


护 。 
* 存储 索引 需要 其 他 文件 ， 如 果 一 次 可 以 打开 的 文件 数 过 多 ， 那 么 可 能 会 导致 操作 系统 问题 。 


当 建 立 索 引 时 ， 请 记 住 将 它们 结合 基 表 数据 一 起 使 用 。 考 虑 分 配 独立 的 DBMS 缓 冲 区 缓存 索引 读 取 ， 不 与 数据 使 用 相同 的 组 
冲 区 。 索 引 项 小 于 完整 表 的 行 ， 因 此 ， 如 果 数 据 库 缓冲 区 中 的 表 数 据 没 有 结合 索引 ， 更 多 的 索引 项 可 以 在 内 存 中 长 时 间 保 存 。 你 
也 可 以 考虑 在 不 同 的 磁盘 驱动 器 中 放置 索引 和 表 数 据 ， 以 减少 磁盘 寻 道 时 间 。 


DBA 必 须 了 解 每 个 DBMS 支 持 的 索引 ， 这 样 就 可 以 创建 索引 来 支持 数据 库 应 用 程序 的 数据 访问 需求 。 下 面 来 了 解 一 下 DBMS 
可 以 支持 的 索引 类 型 : B-tree、 位 图 、 反 向 键 、 索 引 分 区 和 排序 。 


B-tree 索 引 


大 多 数 关 系数 据 库 系统 支持 的 基本 索引 技术 是 B-tree 索 引 。B-tree 是 一 种 加 密 的 、 树 状 索引 结构 。B-tree 索 引 从 根 页 开始 ， 
并 呈 扇 形 延 伸 至 叶 级 页 。 图 4-2 显 示 了 B-tree 索 引 的 基本 结构 。 


B-ttee 是 一 种 加 密 的 、 树 状 索引 结构 。 
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… 表 中 的 数据 
图 4-2 B-tree'ġ 5| 25% 


B-tree 索 引 的 页 称 为 节点 。 节 点 存在 于 B-tree 的 各 个 层级 ， 叶 层级 以 上 的 节点 包含 目录 条 目 和 指向 级 别 较 低 的 B-tree 节 点 的 
指针 。 最 低层 级 的 节点 称 作 叶 级 页 。 叶 级 页 包含 键 值 条 目 和 指向 表 中 单个 数据 行 的 指针 。 向 表 中 添加 数据 时 ，B-tree 索 引 通 过 在 
索引 结构 的 适当 位 置 存储 新 的 键 值 来 更 新 。 要 使 用 索引 访问 数据 ，DBMS 从 根 页 开始 ， 通 过 索引 沿 着 指针 一 直到 叶 层级 键 值 ， 在 
这 里 指针 指向 实际 的 表 数 据 。 每 个 父 节点 都 包含 存储 在 其 直接 依赖 的 节点 的 最 高 键 值 。 只 要 查看 到 键 ， 就 可 以 扫描 B-tree 索 引 叶 


级 页 的 值 的 范围 。 


请 再次 参考 图 4-2。 假 设 运行 查询 与 搜索 条 件 ， 请 求 其 中 键 值 为 53 的 数据 。 此 时 ，DBMS 可 以 遍历 索引 并 在 第 二 个 叶 级 页 停 
止 。 叶 级 页 包含 一 个 指向 表 的 实际 行 的 指针 ， 该 表 包含 请 求 的 键 值 。 最 多 需要 5 次 |/O 请 求 就 满足 此 查询 : 1 次 用 于 索引 每 个 层级 
的 页 面 ， 其 他 4 次 用 于 请 求 表 页 面 。 


使 用 索引 的 访问 请 求 比 表 扫 描 更 好 ， 因 为 可 以 使 用 索引 叶 节 点 的 指针 直接 访问 所 请 求 的 数据 。 对 于 大 多 数 数 据 访问 请 求 来 
说 ， 这 可 以 减少 MO 并 提高 性 能 。 


位 图 索引 


位 图 索引 是 某 些 DBMS 产 品 支 持 的 一 种 索引 类 型 。 位 图 索引 只 能 解决 小 范围 内 的 问题 ， 但 可 以 提供 一 流 的 性 能 。 位 图 索引 对 
不 经 常 修改 且 查 询 量 很 大 的 表 很 有 用 。 此 外 ， 如 果 被 索引 的 列 有 极 少量 的 不 同 值 ( 如 性 别 ( 男 / 女 ) 或 布尔 (AAR) 数据 ) ， 位 
图 索引 最 有 用 。 数 据 仓 库 和 数据 集 市 通常 都 能 从 位 图 索引 受益 。 


位 图 索引 只 能 解决 小 范围 内 的 问题 ， 但 可 以 提供 一 流 的 性 能 。 


位 图 索引 非常 简单 。 位 图 索引 使 用 一 连 串 的 0 和 1 或 位 来 实施 。 对 于 位 图 索引 的 每 个 键 值 ， 都 单独 存储 一 个 0 和 1 的 字符 串 。 
不 同 键 值 的 数目 决定 比特 字符 串 的 数量 。 例 如 ， 为 表 EMPLOYEE 的 SEX 列 定 义 的 位 图 索引 可 能 有 三 个 字符 串 : 一 个 为 男性 ， 一 个 
为 女性 ， 一 个 未 知 。state 列 (美国 境内 的 州 ) 的 位 图 索引 可 能 有 51 个 字符 串 ， 每 个 字符 串 针 对 一 个 州 ， 剩 下 的 1 个 未 知 。 


再 次 考虑 Sex 的 例子 。EMPLOYEE 表 Sex 列 的 位 图 索引 包含 10 行 。 如 上 所 述 ， 位 图 索引 将 包含 三 个 字符 串 ， 每 个 字符 串 10 个 
位 。 该 字符 串 用 1 的 位 置 表示 ， 无 论 0 的 位 置 是 否 改变 ( 变 为 1) ， 该 行 的 Sex 列 都 将 包含 该 特定 字符 串 创 建 时 的 值 。 检 查 以 下 三 
个 位 图 : 

"Male” 1000011101 


"Female” 0110000010 
"Unknown' 0001100000 


这 些 字符 串 表 明 行 1、6、7、8 和 10 为 男性 ， 行 2、3 和 9 为 女性 ， 行 4 和 5 性 别 未 知 。 


寻找 几 个 位 图 索引 值 的 记录 集 ， 只 是 需要 增加 这 些 值 的 字符 串 。 位 图 比 表 扫描 要 快 得 多 ， 正 常情 况 下 甚至 比 B-tree 索 引 检 索 
更 快 。 位 图 索引 的 字符 串 非 常 小 ， 可 以 保存 在 内 存 中 ， 这 最 大 限度 地 减少 了 IO 操作 。 即 使 检索 量 很 大 的 查询 ， 使 用 位 图 的 效率 
也 会 非常 高 。 


位 图 的 问题 是 字段 的 每 个 值 都 需要 一 个 单独 的 字符 串 。 一 列 当中 可 能 要 存放 很 多 不 同 的 值 ， 因 此 ， 位 图 索引 很 不 实际 (因为 
需要 太 多 的 字符 串 ) 。 另 外 ， 位 图 的 0 和 1 不 能 用 于 计算 或 直接 读 取 ， 来 确定 它们 所 代表 的 实际 值 。 这 种 局 限 使 得 位 图 索引 在 大 
多 数 情况 下 不 切实 际 。 某 些 DBMS 产 品 已 经 对 位 图 索引 进行 了 扩展 ， 使 其 对 于 具有 较 高 基数 的 列 更 加 实用 。 如 果 DBMS 支 持 位 图 
索引 ， 一 定 要 了 解 位 图 的 确切 性 质 以 及 位 图 索引 在 何 种 情况 下 可 以 使 用 。 


反 向 键 索引 


反 向 键 索 引 基 本 上 是 一 个 B-tree 索 引 ， 其 中 每 个 索引 列 的 字 节 顺序 相反 。 索 引 中 的 列 的 顺序 不 颠倒 ， 只 是 每 列 的 字 节 变化 。 
这 种 索引 可 以 用 来 消除 OLTP 应 用 程序 中 的 数据 热点 。 当 字 节 的 顺序 相反 时 ， 相 邻 的 键 值 也 不 能 物理 存储 在 一 起 。 因 此 ， 反 向 键 
索引 有 助 于 分 配 其 他 会 集中 在 叶 节点 的 索引 数据 ， 从 而 提高 性 能 。 


反 向 键 索引 可 以 消除 OLTP 应 用 程序 中 的 数据 热点 。 


所 以 ， 如 果 EMPLOYEE 表 的 First Name 列 创建 了 一 个 反 向 键 索 引 ， 要 插入 “Craig”， 使 用 “giarC” 即 可 。 


如 果 DBMS 不 支持 反 向 键 索 引 ， 你 可 以 用 编程 方式 实现 这 一 效果 。 要 做 到 这 一 点 ， 你 需要 使 用 程序 逻辑 (或 者 一 个 退出 例 
程 ， 如 果 DBMS 支 持 ) ， 在 将 值 插 入 列 之 前 ， 先 将 值 反 转 。 当 然 ， 检 索 这 些 值 时 ， 你 需要 通过 程序 再 次 反 转 它们 。 如 果 必 须 临 时 
查询 数据 (程序 没有 实现 ) ， 此 过 程 不 会 正常 工作 。 


分 区 索引 


分 区 索引 基本 上 是 指定 了 如 何 将 索引 (或 底层 表 ) 分 解 成 单独 的 块 或 分 区 的 B-tree 索 引 。 分 区 通常 是 为 了 提高 性 能 和 可 用 
性 。 数 据 分 布 在 多 个 分 区 ， 你 也 许 能 够 在 操作 一 个 分 区 的 同时 不 影响 其 他 分 区 。 例 如 ， 运 行 实用 程序 ， 使 数据 脱 机 ， 或 将 相关 文 
件 放 在 单独 的 磁盘 。 


分 区 通常 是 为 了 提高 性 能 。 
大 多 数 DBM 产品 支持 分 区 ， 但 方式 有 所 不 同 。 在 分 区 之 前 ， 一 定 要 了 解 特定 DBM SS 实现 的 细微 差别 。 
有 序 索引 


大 多 数 DBM 产品 都 会 提供 一 个 选项 ， 用 来 按照 指定 的 顺序 指定 B-tree 键 值 的 顺序 。 如 果 某 个 索引 是 为 了 避免 排序 操作 或 尽 
量 减少 检索 MIN 或 MAX 值 的 MO 需求 ， 指 定 的 顺序 (升序 或 降序 ) 将 对 该 索引 的 可 用 性 产生 影响 。 因 此 ， 为 了 支持 针对 表 所 进行 
的 所 有 查询 类 型 ， 一 定 要 创建 正确 顺序 的 索引 。 


索引 汇总 


索引 是 物理 数据 库 设 计 的 一 个 重要 组 成 部 分 。 事 实 上 ， 优 化 数据 库 应 用 程序 的 性 能 ，DBA 需 要 做 的 最 重要 的 事情 是 创建 有 
效 的 索引 。 为 了 做 到 这 一 点 ，DBA 需 要 知道 正在 使 用 的 DBMS 上 有 哪些 索引 选项 ， 但 更 重要 的 是 ，DBA 必 须 能 够 让 DBMS 索 引 选 
项 与 执行 的 表 处 理 类 型 相 匹 配 。 只 有 通过 检查 操作 数据 库 表 的 SQL 语 句 ， 才 能 制定 有 效 的 索引 策略 。 最 后 要 记 住 ， 特 殊 的 处 理 需 
求 可 能 需要 特殊 的 索引 需求 ， 以 及 可 以 增加 索引 选项 的 ISV 的 附加 产品 。 


42.2 BUI 

获 列 是 一 种 使 用 键 值 开局 数据 的 快速 直接 访问 的 技术 。 使 用 一 种 算法 将 键 值 转换 成 一 个 指针 ， 该 指针 指向 包含 这 些 键 值 的 行 
的 物理 位 置 。 该 算法 通常 称 作 随 机 数 发 生 器 ， 因 为 散 列 例 程 的 目标 是 将 键 值 均匀 分 布 在 整个 物理 存储 中 。 

散 列 使 用 键 值 开 局 数据 的 快速 直接 访问 。 


一 般 情 况 下 ， 随 机 化 算法 越 好 ， 散 列 的 结果 就 越 好 。 当 随机 数 发 生 器 为 两 个 不 同 的 键 值 生成 同一 个 指针 时 ， 冲 突 就 会 发 生 。 
可 以 使 用 不 同 的 方式 来 解决 冲突 。 通 常情 况 下 ， 冲 突 分 解 算法 会 试图 将 数据 保存 在 同一 页 面 上 来 避免 额外 的 MO。 页 面 填 满 后 ， 
冲突 强制 将 数据 放 到 另 一 个 页 面 ， 性 能 会 迅速 下 降 。 


散 列 在 大 量 可 用 空间 中 工作 得 更 好 。 散 列 的 缺点 在 于 必须 要 将 空间 量 预 先 分 配给 被 散 列 的 数据 。 


散 列 有 很 大 的 优势 ， 通 常 检索 使 用 该 码 的 一 行 数据 只 需要 一 次 数据 库 |/O 请 求 。 散 列 对 一 行 或 少量 行 的 直接 数据 查找 的 效率 
最 高 。 如 果 你 需要 检索 数据 的 范围 ， 散 列 不 是 最 佳 的 ， 因 为 数据 将 被 传播 出 去 而 不 是 聚集 ， 所 以 I/O 成 本 将 很 大 。 此 外 ， 散 列 需 


要 一 个 唯一 的 码 来 减少 冲突 。 


因此 ， 只 有 当 绝 大 多 数 表 的 查询 都 基于 使 用 键 查找 并 返回 小 结果 集 时 ， 才 考虑 散 列 。 


4.2.3 ”集群 

集群 描述 了 一 种 物理 存储 表 数 据 的 方式 。 该 术语 是 指数 据 行 在 磁盘 上 保持 一 种 特定 的 顺序 。 通 过 集群 ， 通 常 一 起 访问 的 数据 
可 以 存储 在 相同 或 相 邻 的 数据 库 页 面 。 集 群 可 以 优化 性 能 ， 因 为 检索 数据 需要 较 少 的 MO 请 求 。 

集群 可 以 优化 性 能 ， 因 为 检索 数据 需要 较 少 的 I/O 请 求 。 


其 实 ， 更 准确 地 说 ， 对 于 某 些 产品 ， 集 群 表明 DBMS 应 试图 按照 特定 列 值 的 顺序 来 维护 行 的 顺序 。 播 入 或 修改 数据 时 ， 如 果 
没有 足够 的 可 用 空间 维护 集群 ，DBM SS 通常 不 强制 集群 因此， 集群 表 实际 上 可 能 不 会 在 任何 时 候 都 按键 值 完 全 集群 。 


索引 (通常 称 为 集群 索引 ) 需要 支持 集群 。 作 为 索引 码 的 列 确定 索引 定义 的 表 如 何 被 集群 。 
以 下 情况 ， 可 以 考虑 集群 表 : 
当 大 量 的 查询 检索 数据 范围 基于 特定 列 值 时 。 


- 当 表 中 存在 一 个 外 码 时 。 外 码 通常 代表 一 对 多 关系 中 “多 ”的 一 方 。 通 过 外 码 请 求 数据 的 查询 导致 了 大 量 连续 读 取 ， 这 很 


常见 。 
- 当 数 据 频繁 排序 时 (ORDER BY, GROUP BY, UNION, SELECT DISTINCT, JOINs) > 


当 集群 一 个 表 时 ， 一 定 要 考虑 修改 的 频率 。 插 入 和 更 新 可 能 会 导致 数据 变 得 非 集群 。 相 比 频繁 修改 的 数据 ， 集 群 更 适合 不 经 
常 修改 的 数据 。 但 是 ， 选 择 主 码 集群 是 不 明智 的 ， 因 为 主 码 访问 往往 是 随机 的 ， 而 集群 是 顺序 访问 。 


一 定 要 了 解 DBMS 如 何 实现 集群 。 某 些 DBMS 产 品 将 表 和 集群 索引 合并 成 一 个 结构 ， 这 可 能 需要 修改 你 的 管理 技术 和 程序 。 
也 存在 其 他 集群 差异 。 例 如 ， 虽 然 Oracle 支 持 集群 的 结构 ， 但 它 不 执行 如 上 所 述 的 集群 。 相 反 ， 它 将 多 个 表 的 索引 码 进行 交 
Re 


424 交叉 数据 
如 果 两 个 表 中 的 数据 需要 频繁 连接 ， 可 以 使 用 连接 标准 将 数据 物理 交叉 到 相同 的 物理 存储 结构 。 交 又 可 以 看 作 一 种 特殊 形式 
的 集群 。 


要 更 好 地 理解 数据 交叉 ， 请 参阅 图 4-3。 圆 点 表示 不 同 表 中 的 行 。 根 据 连 接 标 准 ， 磁 盘 上 的 数据 是 交叉 的 。 请 注意 ， 光 点 
( 表 1) 与 暗 点 ( 表 2) 在 同一 文件 中 混合 。 数 据 以 这 种 方式 交叉 ， 可 以 提高 连接 性 能 ， 但 仅 适 用 于 特定 连接 的 数据 交叉 优化 。 


图 4-3 表 数 据 交 又 


不 同 的 DBMS 产 品 支 持 不 同 的 交叉 方式 。Oracle 使 用 集群 支持 某 种 形式 的 交叉 。 对 于 其 他 DBMS， 你 可 能 需要 在 加 载 数据 之 
前 开发 脚本 对 数据 进行 整理 、 排 序 和 交叉 。 无 论 如 何 ， 交 叉 在 少数 情况 下 是 非常 有 用 的 ， 并 且 只 有 当 两 个 表 的 主要 的 访问 是 通过 
特定 的 标准 连接 时 。 


4.3” 非 规范 化 


规范 化 是 把 每 一 个 事实 放 在 最 合适 地 方 的 过 程 。 规 范 化 的 数据 库 实现 将 
代价 。 当 一 个 事实 只 存储 在 一 个 位 置 时 ,检索 许多 不 同 但 彼此 关联 的 事实 通 
È, 但 更 新 变 快 ， 因 为 更 新 的 事实 只 存储 在 一 个 位 置 。 


完整 性 问题 降 到 最 低 ， 并 可 以 优化 更 新 ， 但 以 检索 为 
常 就 需要 检索 许多 不 同 的 位 置 。 这 会 使 检索 过 程 变 


大 多 数 应 用 程序 需要 非常 快速 的 数据 检索 。 有 些 应 用 程序 需要 定期 维护 以 求 优 化 性 能 。 要 做 到 这 一 点 ， 有 了 时 需要 执行 非 规 范 
化 物理 数据 库 。 与 规范 化 以 有 组 织 的 方式 (为 了 消除 元 余 ) 来 汇编 数据 的 过 程 相似 ， 非 规范 化 则 是 故意 向 数据 引入 元 余 的 过 程 。 
换 句 话说 ， 非 规范 化 可 以 认为 是 把 一 个 事实 放 在 许多 位 置 的 过 程 。 这 可 以 加 速 数据 检索 过 程 ， 通 常 以 牺牲 数据 修改 为 代价 。 


非 规范 化 可 以 认为 是 把 一 个 事实 放 在 许多 位 置 的 过 程 。 


4.3.1 ” 何 时 进行 非 规 范 化 


当然 ， 除 非 性 能 需要 ， 或 你 觉得 DBMS 运 行 的 方式 超过 实现 规范 化 带 来 的 好 处 ， 否 则 你 永远 不 应 该 非 规 范 化 数据 。 许 多 
DBMS 产 品 都 有 某 种 不 足以 及 效率 低下 ， 出 于 性 能 方面 的 考虑 ， 可 能 需要 非 规 范 化 。 因 此 ， 实 施 非 规范 化 不 一 定 是 一 个 错误 的 决 
定 。 非 规范 化 之 前 ， 你 应 该 考虑 以 下 间 题 : 


“ 不 进行 非 规范 化 ， 系 统 能 否 达 到 可 接受 的 性 能 ? 
- 非 规范 化 后 ， 系 统 性 能 是 否 仍然 不 可 接受 ? 
- 由 于 非 规范 化 ， 系 统 会 不 会 变 得 不 可 靠 ? 


如 果 这 些 间 题 中 任何 一 个 答案 是 肯定 的 ， 那 么 应 该 避免 非 规范 化 ， 因 为 这 样 做 得 不 偿 失 。 如 果 考 虑 这 些 问题 后 ， 你 决定 非 规 
范 化 ， 一 定 要 坚持 遵循 一 般 准则 。 


如 果 有 足够 的 可 用 磁盘 空间 ， 可 以 考虑 创建 两 组 表 : 一 组 完全 规范 化 ， 另 一 组 非 规范 化 。 通 过 查询 规范 化 表 中 的 数据 来 生成 
非 规范 化 版 本 ， 并 将 其 加 载 或 插入 非 规 学 化 表 中 。 你 的 应 用 程序 可 以 以 只 读 方式 访问 非 规范 化 表 来 实现 性 能 的 提升 ， 同 时 修改 规 


范 化 的 版 本 ， 并 避免 基础 数据 的 完整 性 问题 。 然 而 ， 重 要 的 是 建立 一 个 控制 和 调度 生成 的 函数 ， 使 规范 化 表 与 非 规范 化 表 保 持 同 
步 。 


如 果 两 组 完整 的 表 没 有 足够 的 磁盘 空间 ， 那 就 只 实现 非 规范 化 表 并 通过 编程 来 维护 。 确 保 每 次 只 更 新 一 个 代表 同一 实体 的 非 
规范 化 表 ， 或 使 用 数据 库 触 发 器 来 保持 元 余数 据 的 同步 。 


某 数据 列 复制 在 许多 不 同 的 表 中 时 ， 经 常 要 同时 更 新 或 尽量 处 处 同时 进行 (根据 环境 的 物理 条 件 ) 。 触 发 器 可 以 帮助 做 到 这 


一 点 。 如 果 非 规范 化 表 与 规范 化 表 永 远 不 同步 ， 一 定 要 告知 终端 用 户 批 处 理 报告 和 在 线 查 询 的 数据 可 能 不 合理 ， 但 如 果 可 能 ， 应 
避免 这 样 做 。 


最 后 ， 一 定 要 对 应 用 程序 进行 设计 ， 以 便 它 可 以 很 容易 地 从 使 用 非 规 学 化 表 转 化 为 使 用 规范 化 表 。 


应 记录 下 每 一 个 非 规 范 化 决策 ， 包 括 决策 的 原因 和 规范 化 逻辑 数据 模型 所 进行 的 确切 变更 。 这 样 的 记录 可 以 为 以 后 的 数据 库 
变更 提供 信息 。 文 档 也 应 记 清 楚 ， 而 不 是 简单 地 设计 或 执行 错误 。 


应 记录 下 每 一 个 非 规范 化 决策 。 


请 记 住 ， 非 规范 化 关系 设计 只 存在 一 个 正当 的 理由 ， 即 提升 性 能 。 下 列 标准 有 助 于 识别 潜在 的 非 规范 化 目标 : 


“ 多 个 关键 查询 或 报告 需要 多 个 表 的 数据 ， 换 和 句 话说 ， 需 要 连接 。 如 果 这 些 请 求 需要 在 一 种 在 线 的 事务 环境 中 处 理 ， 非 规范 
化 也 许可 以 提高 性 能 。 


“ 重复 组 需要 按 组 处 理 而 不 是 分 开 处 理 。 


:成功 查 询 需要 对 一 个 或 多 个 列 进行 计算 。 存 储 衍 生 或 预计 算 的 数据 可 以 减少 检索 的 IO 次 数 和 CPU 使 用 率 ， 因 此 效率 更 


it 
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“ 许多 大 型 主 码 承载 为 相关 表 的 外 码 列 时 ， 不 便于 查询 而 且 消 耗 大 量 磁盘 空间 。 
- 查询 某 些 列 占据 大 部 分 时 间 时 ， 造 成 要 使 用 非常 复杂 或 低 效 的 SQL。 


当然 ， 这 些 情况 并 不 总 是 需要 非 规 范 化 ， 但 它们 可 以 用 作 非 规范 化 的 适应 范围 ， 这 就 提出 了 一 个 问题 : DBA 应 在 何 时 进行 
非 规范 化 数据 库 设 计 ? 虽然 你 可 能 会 认为 在 物理 设计 初期 非 规 范 化 更 容易 ， 情 况 通 常 并 非 如 此 。DBA 和 应 用 程序 设计 者 往往 很 
早 就 决定 了 非 规范 化 ， 在 他 们 能 够 证 明 其 必要 性 之 前 。 即 使 将 部 分 已 完成 的 系统 改造 为 可 以 在 非 规范 化 的 结构 上 运行 很 有 难度 ， 
但 在 你 确定 规范 化 设计 无 法 充分 执行 之 后 再 进行 非 规范 化 为 时 不 晚 。 当 然 ， 有 时 DBA 对 具体 应 用 程序 、DBMS 和 版 本 都 有 直接 经 
验 。 在 这 种 情况 下 ， 进 行 物理 设计 的 非 规范 化 是 可 以 接受 的 。 然 而 ， 这 样 的 情况 相当 少见 。 


要 知道 ,通常 每 个 新 的 RDBMS 版 本 都 会 带 来 性 能 的 提升 和 改进 的 访问 选项 ， 这 可 能 会 降低 非 规范 化 需要 。 然 而 ， 大 多 数 流 
行 的 RDBM 产品 需要 非 规 学 化 的 数据 结构 。 许 多 不 同类 型 的 非 规范 化 表 可 以 解决 访问 完全 规范 化 的 数据 时 所 引起 的 性 能 问题 。 
以 下 详细 介绍 了 这 些 非 规范 化 表 ， 并 对 何 时 实施 它们 提出 了 建议 。 


在 任何 情况 下 都 不 要 尝试 创建 非 规 范 化 的 逻辑 数据 模型 。 逻 辑 数据 模型 应 该 是 规范 化 的 。 数 据 库 的 物理 实现 可 以 不 同 于 数据 
模型 ， 但 模型 应 是 完全 规范 化 的 ， 总 之 ， 数 据 模 型 的 所 有 物理 变化 都 应 记录 。 


不 要 尝试 创建 非 规范 化 的 逻辑 数据 模型 。 


43.2 FURR 


如 果 应 用 程序 需要 两 个 或 多 个 表 定 期 进行 连接 ， 但 连接 的 成 本 又 很 高 ， 这 时 可 以 考虑 创建 预 连接 表 。 预 连接 表 应 
: 不 含 宛 余 列 。 

` 只 包含 那些 绝对 必要 的 列 ， 以 满足 应 用 程序 的 处 理 需 求 。 

* 定期 创建 ， 使 用 SQL 来 连接 规范 化 的 表 。 


预 连接 的 好 处 是 连接 的 成 本 仪 产 生 一 次 ， 即 在 预 连接 表 创 建 时 。 预 连接 表 查 询 效 率 很 高 ， 因 为 每 个 新 的 查询 都 不 产生 连接 开 


然而 ， 预 连接 的 缺点 (与 大 多 数 非 规范 化 一 样 ) 是 难以 保持 数据 的 准确 性 。 预 连接 表 可 能 很 快 就 会 与 创建 它们 的 独立 表 不 同 
步 。 因 此 ， 预 连接 表 对 静态 数据 比 动态 数据 更 有 用 。 


43.3 ”报告 表 


通常 情况 下 ， 只 使 用 SQL 不 可 能 开发 出 终端 用 户 报告 。 这 样 的 报告 可 能 需要 特殊 的 格式 或 数据 处 理 。 如 果 某 些 天 键 或 高 度 可 
见 的 报告 需要 在 网 络 环境 中 查看 ， 那 么 可 以 考虑 创建 一 个 代表 该 报告 的 表 。 然 后 可 以 在 查询 工具 或 报告 工具 中 使 用 独立 SQL 对 该 
表 进 行 查 询 。 报 告 中 的 数据 应 由 批 处 理 环 境 中 合适 的 机 制 (应 用 程序 、4GL 和 SQL 等 ) 创建 ， 然 后 将 其 按 顺 序 加 载 到 报告 表 中 。 
报告 表 应 该 : 


:包含 一 列 ， 可 用 于 报告 的 每 一 列 。 


“ 所 有 的 行 按照 应 出 现在 报告 中 的 顺序 进行 物理 排序 ， 因 此 不 需要 额外 的 排序 。 
- TAARKA] (如 1NFE 和 原子 数据 元 素 ) 。 
报告 表 应 包含 一 列 ， 可 用 于 报告 的 每 一 列 。 


报告 表 适 合 携带 多 个 连接 和 外 部 连接 结果 、 相 关子 查询 结果 ， 或 其 他 复杂 的 SQL 语句 。 如 果 编 写 一 个 复杂 的 查询 ， 运 行 ， 然 
后 将 其 加 载 到 一 个 表 中 ， 可 以 使 用 一 个 简单 的 SELECT 语句 检索 结果 ， 而 不 是 用 于 生成 报告 表 的 复杂 (或 许 更 慢 ) 查询 。 


4.3.4 ”镜像 表 


如 果 一 个 应 用 程序 系统 非常 活跃 ， 可 能 需要 将 其 拆 分 成 两 个 (或 更 多 ) 不 同 的 组 件 。 这 种 拆 分 将 导致 创建 副本 表 或 镜像 表 。 
例如 ， 假 设 一 个 应 用 系统 在 早晨 和 午后 有 非常 大 的 网 络 流量 。 该 流量 包括 查询 和 数据 修改 。 下 午 ， 决 策 支 持 处 理 也 在 同一 个 应 用 
程序 表 上 进行 。 下 午 的 生产 工作 似乎 总 会 扰乱 决策 支持 处 理 ， 经 常 导 致 超时 和 和 死 锁 。 


创建 镜像 表 可 以 解决 这 些 中 断 ， 即 前 台 表 集合 用 于 生产 流量 ， 后 台 表 集合 用 于 决策 支持 。 必 须 建立 一 种 机 制 ， 定 期 将 前 台数 
据 迁 移 到 后 台 表 中 ， 以 保持 应 用 程序 数据 同步 。 这 样 的 机 制 可 能 是 一 个 执行 UNLOAD 和 LOAD 实 用 程序 的 批 处 理 作 业 。 另 一 种 
可 能 性 是 使 用 内 置 的 复制 和 传播 软件 (如果 DBMS 支 持 ) 。 无 论 如 何 ， 尽 可 能 经 常 进行 数据 同步 ， 以 维持 决策 支持 处 理 的 有 效 
性 。 


重要 的 是 ， 决 策 支 持 的 访问 需求 往往 与 生产 环境 的 访问 需求 不 同 。 因 此 ， 有 关 数 据 定义 (如 索引 和 集群 ) 的 不 同 决策 也 适用 
于 镜像 表 。 


此 外 ， 简 单 的 镜像 表 未 必 足 以 支持 你 的 决策 需求 。 也 许 你 需要 创建 一 个 成 熟 的 数据 仓库 环境 。 数 据 仓库 是 一 种 关系 型 数据 
库 ， 专 门 为 决策 支持 和 分 析 查 询 而 设计 。 


4.3.5 ROR 


如 果 规 范 化 表 分 别 被 不 同 的 用 户 组 或 应 用 程序 访问 ， 考 虑 将 其 拆 分 成 两 个 (或 更 多 ) 非 规范 化 表 ， 分 别 用 于 不 同 的 处 理 组 。 
如 果 其 他 应 用 程序 访问 整个 表 ， 原 来 的 表 也 可 以 保留 下 来 。 在 这 种 情况 下 ， 被 拆 分 的 表 应 作为 镜像 表 的 特殊 情况 。 如 果 不 需要 额 
外 的 表 ， 可 以 使 用 连接 表 的 视图 代 蔡 。 


表 拆 分 有 两 种 方式 : 垂直 或 水 平 。 垂 直 拆 分 表 将 表 的 各 列 分 隔 为 单独 的 表 ， 一 组 列 放 到 一 个 新 表 中 ， 其 余 的 列 放 到 另 一 个 新 
表 中 。 主 码 列 同时 放 到 两 个 新 表 中 。 


为 了 参照 完整 性 ， 应 指定 两 个 新 表 中 的 一 个 为 父 表 ， 如 果 原 始 表 仍然 存在 ， 它 应 该 作为 满足 所 有 参照 约束 的 父 表 。 如 果 原 始 
表 仍 然 人 存在 且 拆 分 表 是 只 读 的 ， 不 要 为 拆 分 表 设 置 参照 完整 性 。 因 为 拆 分 表 均 来 自 完整 引用 源 ， 不 需要 参照 完整 性 。 


表 拆 分 有 两 种 方式 : 重 直 或 水 平 。 


如 果 是 垂直 拆 分 表 ， 每 个 拆 分 表 的 主 码 总 是 包括 一 行 。 不 要 以 任何 理由 从 新 表 中 删除 任何 行 。 如 果 删 除 行 ， 必 须 访 问 这 两 个 
表 的 数据 的 更 新 过 程 和 任何 检索 过 程 ， 这 会 显得 过 于 复杂 。 


水 平 拆 分 表 将 表 的 行 分 成 单独 的 表 。 如 果 要 水 平 拆 分 表 ， 那 么 需要 将 所 有 的 行 根据 键 范围 归 成 几 组 。 一 个 键 范围 内 的 行 放 到 
一 个 表 中 ， 另 一 个 键 范围 内 的 行 放 到 另 一 个 表 中 ， 依 此 类 推 。 水 平 拆 分 表 的 列 是 相同 的 。 对 于 水 平 拆 分 ， 避 免 在 新 表 中 复制 行 。 
要 做 到 这 一 点 ， 使 用 主 码 进行 拆 分 并 确保 每 个 键 值 只 分 配给 一 个 新 表 。 

拆 分 长 文本 列 


垂直 拆 分 的 一 种 特殊 情况 是 可 以 拆 分 非常 大 的 文本 列 。 例 如 ， 考 虑 一 个 表 ， 用 来 存储 商品 描述 。 拉 述 可 以 是 100 字 节 ， 但 大 
多 数 处 理 只 需要 前 10 字 节 。 例 如 ， 考 虑 这 个 CREATE TABLE 语 句 。 


CREATE TABLE ITEM 


(ItemNum integer not null, 
ItemSize CHAR(1), 

ItemColor CHAR(10), 

ItemDescr CHAR(100) 


在 这 种 情况 下 ， 通 过 将 摘 述 拆 分 为 两 列 ， 可 以 将 一 个 表 拆 分 为 两 个 表 。 一 个 新 列 (保持 在 旧 表 中 ) 将 占用 描述 的 前 10 字 
节 。 第 二 个 列 (位 于 使 用 主 码 创建 的 新 表 中 ) 将 占用 后 面 90 字 节 的 描述 。 例 如 : 


CREATE TABLE ITEM 


(ItemNum INTEGER NOT NULL, 
ItemSize CHAR(1), 
ItemColor CHAR(10), 
ItemDescr CHAR(10) 


CREATE TABLE ITEM_DESC 
(ItemNum INTEGER NOT NULL, 
ItemDesc CHAR(90) 


这 种 类 型 的 非 规范 化 对 MO 有 好 处 : 每 一 个 物理 页 面 可 以 存储 的 行 更 多 ， 因 为 主 表 的 每 一 行 变 得 更 小 。 只 有 那些 要 所 有 100 
字 节 的 任务 才 需 要 访问 两 个 表 。 当 然 ， 这 类 非 规范 化 也 有 变化 。 只 需要 访问 描述 时 ， 你 可 以 选择 只 将 前 10 字 节 存 储 在 主 表 中 ， 
而 所 有 的 100 字 节 存 储 在 描述 表 中 。 另 一 方面 ， 如 果 描 述 非常 长 ， 你 可 以 将 其 在 描述 表 中 分 成 多 行 。 例 如 ， 如 果 描 述 长 达 10000 
字 节 ， 但 大 部 分 不 足 1000 字 节 ， 你 不 会 想 要 创建 一 个 10000 字 节 的 字符 列 (即使 DBMS 人 允许 这 样 做 ) 。 相 反 ， 你 可 以 创建 一 个 这 
样 的 表 : 


CREATE TABLE ITEM_DESC 


(ItemNum INTEGER NOT NULL, 
ItemCtr INTEGER NOT NULL, 
ItemDesc CHAR(100) 


这 种 类 型 的 非 规 范 化 对 I/O 有 好 处 。 


在 这 个 例子 中 ， 描 述 表 的 主 码 是 itemNum 和 ItemCcCtr 的 组 合 ， 其 中 ItemNum 存 储 了 描述 行 的 数量 ，ltemCtr 是 计数 器 。 这 
种 设计 将 描述 分 成 100 字 节 块 。 对 于 最 大 的 值 ， 将 需要 100 行 来 存储 所 有 10000 字 节 ， 但 对 于 大 多 数 的 描述 信息 ， 只 需要 10 个 或 
更 少 的 行 。 


4.3.6 HER 


如 果 表 以 一 对 一 的 关联 存在 ， 可 以 考虑 把 它们 组 合成 一 个 表 。 当 然 ， 如 果 每 个 一 对 一 天 联 的 参与 者 对 其 他 表 有 不 同 的 关联 ， 
非 规范 化 时 需要 考虑 这 一 点 。 有 了 时 甚至 一 对 多 的 关联 可 以 组 合成 一 个 表 ， 但 数据 更 新 过 程 将 会 复杂 化 ， 因 为 增加 了 元 余数 据 。 


考虑 将 一 对 一 关联 的 表 组 合成 一 个 表 。 


例如 ， 考 虑 一 个 应 用 程序 ， 它 有 两 个 表 : DEPT ( 含 部 门 数据 ) 和 EMP ( 含 雇 员 数据 ) 。 你 可 能 通过 将 两 个 表 组 合成 一 个 名 
为 EMP_AND_DEPT 的 大 表 ， 而 实现 非 规范 化 。 除 了 宛 余 的 外 码 ， 这 个 新 表 将 包含 两 个 表 的 所 有 列 。 所 以 ， 除 了 所 有 的 雇员 信 
息 ， 所 有 的 部 门 信息 也 将 包含 在 每 个 雇员 行 中 。 这 将 导致 部 门 数 据 重 复 。 这 种 组 合 表 可 以 认为 是 预 连接 表 ， 并 对 其 进行 相应 处 
理 。 


应 始终 对 “一 对 一 ”关联 的 表 进 行 分 析 ， 以 确定 组 合 是 否 有 用 。 有 时 规范 化 (而 不 是 非 规 范 化 ) 可 以 巩固 “一 对 一 ”关联 。 


4.3.7 TRACE 
有 了 时候， 访问 表 的 一 列 或 多 列 时 ， 需 要 查询 另 一 个 表 中 几乎 每 一 个 时 间 数 据 。 在 这 种 情况 下 ， 可 以 考虑 将 列 作为 元 余数 据 追 
加 到 | 查询 表 。 表 中 加 入 这 些 额 外 的 列 ， 可 以 避免 连接 ， 还 可 以 提升 性 能 。 只 有 标准 的 数据 访问 执行 不 充分 时 才 应 该 尝试 这 么 做 。 


再 次 考虑 DEPT 和 EMP 表 。 如 果 大 部 分 的 雇员 查询 要 求 雇员 部 门 的 名 称 ， 部 门 名 称 列 可 以 当 作 EMP 表 中 的 元 余数 据 。 但 该 列 
不 应 该 从 DEPT 表 中 删除 。 元 余 存 储 的 列 应 具有 以 下 特点 : 


“ 只 需要 几 列 支持 宛 余 。 
* 列 应 该 是 稳定 的 ， 偶 尔 需要 更 新 。 


列 应 该 被 大 量 的 用 户 或 一 些 非常 重要 的 用 户 使 用 。 


438 ”重复 组 


规范 化 过 程 将 重复 组 转换 成 不 同 的 行 ， 而 不 是 同一 行 的 单独 列 。 即 使 重复 组 的 规范 化 可 以 优化 数据 的 完整 性 和 提升 性 能 ， 但 
导致 更 高 的 磁盘 使 用 率 和 较 低 的 检索 效率 。 因 为 为 了 满足 访问 重复 组 的 查询 ， 表 中 的 行 变 得 更 多 ， 需 要 读 取 的 行 就 变 


ai i 


它 通常 会 
多 


FSS. 


有 时 通过 将 这 些 组 非 规范 化 成 不 同 的 列 ， 就 可 以 获得 性 能 的 显著 收益 。 然 而 ， 这 些 收 益 以 牺牲 灵活 性 为 代价 。 例 如 ， 一 个 应 
用 程序 将 重复 组 信息 存储 到 一 个 表 : 


CREATE TABLE CUST_BALANCE 


(CustNum INTEGER NOT NULL, 
BalancePeriod INTEGER NOT NULL, 
Balance DECIMAL(15,2), 


constraint PKCB PRIMARY KEY (CustNum, BalancePeriod) 


每 名 客户 可 以 在 这 个 表 存 储 无 限 多 的 差额 ， 并 且 只 受 限 于 可 用 存储 空间 和 DBMS 的 存储 限制 。 如 果 决 定 将 串 重复 组 、 差 额 存 


储 在 列 而 不 是 行 ， 那 么 需要 对 每 一 行 的 差额 设置 一 个 限制 。 下 面 是 该 表 非 规范 化 后 的 一 个 例子 : 
CREATE TABLE CUST_BALANCE 
(CustNum INTEGER NOT NULL, 


Periodl Balance DECIMAL(15,2), 
Period2_ Balance DECIMAL(15,2), 


在 这 个 例子 中 ,任何 一 个 客户 只 可 以 存储 6 个 差额 。 设 计 人 员 可 以 很 容易 地 选择 存储 8 个 、12 个 或 任意 数量 的 差额 。 数 字 6 并 


不 重要 ， 值 的 数目 受 限 很 重要 。 这 降低 了 数据 存储 的 灵活 性 ， 除 非 性 能 需要 ， 否 则 应 当 避 免 。 


使 用 第 一 个 设计 ， 需 要 检索 6 行 ， 获 得 6 个 差额 。 使 用 第 二 个 设计 ， 只 读 取 一 行 就 可 以 检索 所 有 6 个 差额 。 因 此 ， 使 用 非 规范 
化 设计 检索 的 性 能 可 能 会 更 好 。 在 决定 执行 重复 组 列 而 不 是 行 之 前 ， 确 保 满足 下 列 条 件 : 


数据 很 少 或 从 未 进行 行内 汇总 、 平 均 或 比较 。 
.数据 通过 正常 模式 以 统计 学 方式 出 现 。 


据 出 现 的 次 数 很 稳定 。 


We 
oo 


“数据 通常 是 共同 访问 的 。 


SE 


据 插 入 和 删除 具有 可 预测 的 模式 。 


a) 


如 果 不 符合 任何 一 个 标准 ， 可 能 很 难 对 某 些 类 型 的 数据 检索 进行 编码 ， 数 据 也 会 不 可 用 。 这 种 情况 应 尽量 避免 ， 因 为 数据 非 
规范 化 是 为 了 使 其 可 用 性 更 好 。 


43.9 可 导 性 数据 


如 果 使 用 复杂 的 公式 导出 数据 的 成 本 很 高 ， 可 以 考虑 将 导出 的 数据 物理 存储 在 列 而 不 需要 进行 计算 。 例 如 ， 员 工 数 据 分 散在 
多 个 表 中 。 也 许 数据 库 包 含 存储 员工 薪酬 数据 的 几 个 表 的 三 个 列 。 这 些 列 分 别 是 工资 、 奖 金 和 佣金 。 此 外 ， 假 设 查询 要 求 报告 总 
薪酬 ， 即 这 三 列 的 总 和 ， 那 么 可 以 在 主 EMP 表 中 包括 名 为 TotalCompensation 的 列 ， 它 是 工资 、 奖 金 和 佣金 的 总 和 ， 从 而 避免 
了 多 表 连 接 和 计算 。 尽 管 这 个 例子 只 显示 了 一 个 简单 的 加 法 ， 但 某 些 业务 的 计算 是 相当 复杂 的 ， 需 要 大 量 的 /O 和 CPU 处 理 来 完 
成 。 计 算 越 复杂 ， 要 求 的 资源 越 多 ， 你 获得 的 性 能 收益 就 越 好 (通过 将 它 存 储 在 数据 库 中 ， 而 不 是 每 次 需要 时 重新 计算 ) 。 


表 中 包括 导出 的 列 ， 可 以 避免 多 表 连 接 和 计算 。 


然而 ， 当 构成 计算 值 的 基本 值 发 生变 化 时 ， 存 储 的 导出 数据 也 必须 改变 ， 否 则 存储 的 信息 将 不 一 致 。 这 种 不 正确 的 数据 将 对 
数据 库 的 可 用 性 、 有 效 性 和 可 靠 性 产生 不 利 影响 。 为 了 避免 这 样 的 问题 ， 符 合 下 列 条 件 时 ， 可 以 考虑 只 存储 导出 的 数据 : 


* 用 于 推导 计算 的 源 数据 是 相对 静态 的 。 
- 进行 推导 计算 的 成 本 相当 高 。 
* 源 表 的 使 用 模式 是 这 样 的 : 源 数据 发 生变 化 时 ， 可 以 快速 重新 计算 。 


有 时 导出 数据 依赖 的 列 发 生变 化 时 ， 立 即 更 新 导出 的 数据 元 素 是 不 可 能 的 。 包 含 导出 元 素 的 表 脱 机 或 由 实用 程序 操作 时 ， 这 
种 情况 可 能 发 生 。 只 要 有 可 能 ， 一 定 要 计算 导出 数据 更 新 的 时 间 ， 以 便 源 表 再 次 可 用 时 ， 可 以 立即 导出 。 在 任何 情况 下 都 不 应 使 
用 过 时 的 导出 数据 进行 报告 和 查询 。 


4.3.10 “层次 结构 


层次 是 一 种 由 关系 数据 库 支持 的 结构 ， 但 它 可 以 导致 数据 检索 困难 ， 除 非 DBMS 支 持 用 于 遍历 层次 的 SQL 扩 展 。 因 此 经 常 需 


要 层次 结构 的 应 用 程序 包含 非 规范 化 的 表 ， 来 提高 数据 检索 速度 。 
经 常 需要 层次 结构 的 应 用 程序 包含 非 规范 化 的 表 ， 来 提高 数据 检索 速度 。 


大 多 数 人 在 数据 处 理 过 程 中 都 遇 到 过 至 少 一 个 层次 。 两 种 常见 的 层次 结构 是 材料 清单 应 用 程序 和 部 门 组 织 系统 。 材 料 清单 应 
用 程序 通常 记录 零 部 件 信息 ， 其 中 一 个 零件 由 其 他 零件 组 成 ， 而 它 又 可 能 是 另 一 个 零件 的 组 成 部 分 。 部 门 组 织 系统 通常 记录 部 门 


组 织 结构 ， 说 明 哪 些 部 门 应 该 向 其 他 部 门 汇 报 。 部 门 组 织 的 层次 结构 表 的 典型 应 用 是 : 
CREATE TABLE DEPT 
(ParentDeptNum INTEGER NOT NULL, 
DeptName CHAR(25), 
SupervisorNum INTEGER, 
ReportsToDeptNum INTEGER, 
constraint PKDN PRIMARY KEY (DeptNum), 
constraint FKCB FOREIGN KEY (ReportsToDeptNum) REFERENCES 
DEPT 
ON DELETE RESTRICT 


为 了 支持 这 样 一 个 层次 ,需要 为 单个 表 设 定 一 对 多 的 关联 。 在 这 个 例子 中 ReportsTo DeptNum 列 是 指向 主 码 DeptNum 的 
外 码 。 每 个 部 门 只 向 一 个 部 门 汇报 ， 但 一 个 部 门 可 以 有 一 个 以 上 的 部 门 向 它 报告 。 


这 样 的 表 代 表 一 个 用 于 存储 层次 结构 的 正确 规范 化 的 实体 。 完 整 的 层次 结构 可 以 使 用 适当 的 数据 检索 指令 重建 。 然 而 ,考虑 
编写 SQL 查 询 这 个 表 与 报告 部 门 组 织 的 难度 。 只 使 用 SQL 来 完成 这 样 的 任务 是 不 可 能 的 ， 除 非 你 对 可 能 存在 的 报告 层级 数 有 一 些 
指导 性 的 知识 或 你 的 DBMS 支 持 用 于 遍历 层次 结构 的 SQL 扩 展 。 


一 种 非常 有 效 的 非 规范 化 层次 结构 的 方式 是 建立 速度 表 。 为 了 方便 检索 ， 违 度 表 包含 一 个 预 遍 历 层次 结构 。 速 度 表 如 下 所 


示 : 


CREATE TABLE DEPT 


(DeptNum INTEGER NOT NULL, 
ChildDeptNum INTEGER NOT NULL, 
Level INTEGER, 

Detail CHAR(1), 

DeptName CHAR(25), 


SupervisorNum INTEGER, 
constraint PKDN PRIMARY KEY (DeptNum, ChildDeptNum) 


一 种 非常 有 效 的 非 规范 化 层次 结构 的 方式 是 建立 速度 表 。 


速度 表 包 含 一 个 行 ， 可 用 于 每 个 从 属 ChildDeptNum ， 而 不 只 是 直系 从 属 。 速 度 表 的 主 码 是 DeptNum 和 ChildDeptNum 的 
组 合 。 提 供 了 另外 两 列 : 


“ 名 为 Level 的 列 包含 一 个 数值 ， 表 示 ChildDeptNum 在 层次 结构 中 的 层级 。 例 如 ， 如 果 驻 留 的 子 层级 低 于 父 层 级 两 个 层 
次 ，Level 包 含 的 值 为 2。 


- 如 果 ChildDeptrNum 在 层次 结构 的 最 底层 ， 名 为 Detail 的 列 包含 “Y”， 否 则 是 “N” 


" 速度 表 必 须 以 编程 方式 创建 ， 它 不 能 使 用 SQL 生成 。 


4.3.11 ”特殊 物理 实施 需求 


有 时 ， 数 据 库 的 需求 与 DBBMS 的 物理 实现 细节 不 会 因为 性 能 而 融合 在 一 起 。 例 如 ， 一 些 DBMS 产 品 对 可 以 指定 给 数据 库 文件 


的 物理 块 大 小 有 限制 。 有 时 ， 逻 辑 数据 模型 中 表 的 行 的 大 小 可 能 需要 一 个 非常 大 的 块 ， 因 为 较 小 的 块 完全 不 适合 它 。 某 些 DBMS 
产品 处 理 大 数据 块 的 效率 很 低 。 在 这 种 情况 下 ， 你 可 能 要 分 解 行 来 非 规 学 化 表 ， 这 样 较 小 的 块 就 适合 它 了 。 这 仪 是 一 个 可 能 要 求 
非 规范 化 的 物理 DBMS 实 现 细节 的 例子 。 


4.3.12” 非 规范 化 小 结 


前 面 已 经 讨论 了 10 种 不 同类 型 的 非 规范 化 。 表 4-1 总 结 了 各 类 非 规 范 化 的 使 用 情况 。 


表 4-1 非 规范 化 的 类 型 


非 规范 化 fa R 
预 连接 表 连接 成 本 太 高 时 使 用 
报告 表 需要 特别 关键 的 报告 时 使 用 
镜像 表 表 被 不 同类 型 的 环境 并 发 访问 时 使 用 
拆 分 表 不 同 组 使 用 表 的 不 同 部 分 时 使 用 
组 合 表 用 于 将 一 对 一 或 一 对 多 关联 组 合成 一 个 表 
SUAS BT 用 于 减少 连接 所 需 的 表 的 数量 
重复 组 用 于 降低 VO 和 存储 使 用 (如 果 可 能 ) 
可 导 性 数据 用 于 消除 算法 和 计算 
速度 表 用 于 使 层次 处 理 更 加 高 效 
物理 非 规 范 化 用 于 优化 特殊 物理 DBMS 的 特征 


不 要 轻易 进行 非 规范 化 ， 因 为 它 可 能 会 导致 完整 性 问题 ， 并 带 来 大 量 的 管理 工作 。 额 外 的 管理 任务 包括 : 
- 记录 每 一 个 非 规范 化 决策 。 

确保 所 有 的 数据 仍然 有 效 、 准 确 。 

安排 数据 迁移 和 传播 工作 。 

` 使 终端 用 户 了 解 表 的 状态 。 

:定期 分 析 数 据 库 ， 以 决定 是 否 仍 需要 非 规范 化 。 


如 果 数 据 库 已 经 非 规范 化 ， 硬 件 、 软 件 和 应 用 程序 的 需求 有 任何 变更 时 ， 应 定期 检查 数据 和 环境 。 任 何 变更 都 可 能 改变 非 规 
范 化 的 需要 。 要 验证 非 规 学 化 是 否 仍然 是 一 个 有 效 的 决定 ， 需 要 考虑 以 下 问题 : 


任何 变更 都 可 能 改变 非 规范 化 的 需要 。 


* 应 用 程序 的 处 理 需求 变更 ， 如 连接 标准 、 报 告 计 时 或 事务 吞吐 量 需求 ， 是 否 不 再 表示 一 个 非 规范 化 的 数据 库 ? 
: DBMS 的 新 版 本 是 否 提高 了 性 能 ? 例如 ， 新 的 连接 方法 或 性 能 技术 的 介绍 是 否 撤销 了 预 连接 表 的 需要 ? 


“ 新 的 硬件 版 本 是 否 改变 了 性 能 考虑 ? 例如 ， 升 级 到 一 个 新 的 、 更 快 的 处 理 器 来 提供 额外 的 CPU 资源 ， 非 规范 化 是 否 就 没有 
必要 了 ? 或 者 增加 内 存 可 以 加 速 数据 的 访问 ， 因 此 数据 就 可 以 物理 实现 规范 化 了 ? 


一 般 情 况 下 ， 定 期 对 处 理 规范 化 表 相关 的 确切 成 本 进行 测试 ， 可 以 证 明 非 规范 化 的 好 处 。 你 应 该 评估 下 列 标准 : 


:节省 的 I/O。 

. 节省 的 CPU。 

- 数据 修改 的 复杂 度 。 

- 返回 到 规范 化 设计 的 成 本 。 


永远 记 住 ， 实 施 非 规范 化 是 为 了 提高 性 能 。 如 果 环 境 发 生变 化 ， 应 该 对 非 规 范 化 决策 进行 重新 评估 。 此 外 ， 鉴 于 不 断 变 化 的 
硬件 和 软件 环境 ， 非 规范 化 表 可 能 会 导致 性 能 退化 ， 而 不 是 性 能 增强 。 简 单 地 说 ， 随 时 监测 并 定期 对 所 有 非 规范 化 的 应 用 程序 进 
行 重新 评估 。 


物理 数据 库 设 计 的 另 一 个 方面 是 创建 数据 库 视 图 ， 以 支持 特定 的 应 用 程序 数据 需求 。 视 图 并 不 需要 访问 物理 数据 库 ， 但 它 对 
支持 特定 的 应 用 程序 和 用 户 需求 有 所 帮助 。 你 可 以 将 视图 看 作 一 种 将 SELECT 语句 转变 为 可 以 使 用 SQL 访问 的 表 的 方式 。 因 此 ， 
视图 可 以 视 为 一 个 逻辑 表 。 没 有 任何 物理 结构 需要 视图 ， 它 是 存储 在 其 他 表 (或 其 他 视图 ) 中 的 数据 的 表示 方法 。 如 图 4-4 所 
示 ，“ 视 图 中 ”的 数据 没有 存储 在 任何 地 方 ， 它 只 存在 基本 表 中 。 视 图 也 可 以 基于 其 他 视图 。 


图 4-4 什么 是 视图 


视图 是 灵活 的 ， 可 以 包含 以 下 任意 组 合 : 

RH: 可 以 是 单个 表 的 行 的 子 集 ， 单 个 表 的 所 有 行 ， 多 个 表 的 行 的 子 集 ， 或 多 个 表 的 所 有 行 。 
“ 视图 行 : 可 以 和 以 上 列 出 的 表 的 行 的 组 合 相同 。 

“ 表 的 列 : 可 以 是 单个 表 的 列 的 子 集 ， 单 个 表 的 所 有 列 ， 多 个 表 列 的 子 集 ， 或 多 个 表 的 所 有 列 。 

“ 视图 列 : 可 以 和 以 上 列 出 的 表 的 列 的 组 合 相同 。 


创建 视图 应 基于 其 对 应 用 程序 开发 和 临时 查询 用 户 的 有 用 性 。 视 图 一 般 有 六 种 基本 用 途 。 视 图 可 以 


- 提供 行 级 和 列 级 安全 性 ; 
. 确保 高 效 的 访问 路 径 ; 
屏蔽 用 户 的 复杂 性 ; 
:确保 数据 导出 正确 ; 
EPAR; 

-EREA 


无 论 如 何 ， 一 定 记录 每 一 个 视图 的 创建 预期 ， 以 便 将 来 任何 视图 访问 那些 改变 了 的 表 时 ， 都 可 以 找到 数据 库 表 的 结构 变化 。 


45 数据 定义 语言 


所 有 物理 数据 库 对 象 的 创建 都 使 用 SQL 数据 定义 语言 (Data Definition Language, DDL) 。DDL 的 基本 组 成 部 分 是 
CREATE、ALTER 和 DROP 语 句 。 顾 名 思 义 ，CREATE 用 来 初次 创建 一 个 数据 库 对 象 。 如 果 数 据 库 对 象 已 经 创建 ， 一 旦 需要 修 
改 ， 就 可 以 使 用 ALTER 语 句 。 但 ALTER 语 句 不 一 定 用 来 改变 任何 数据 库 对 象 (第 7 章 中 有 更 详细 的 描述 ) 以 及 数据 库 对 象 的 任何 
一 个 方面 。 最 后 ，DROP 语 句 用 来 从 系统 中 删除 数据 库 对 象 。 


所 有 物理 数据 库 对 象 的 创建 都 使 用 SQL 数据 定义 语言 。 


许多 DBMSs 产 品 提供 了 一 个 图 形 界面 ， 用 于 创建 和 更 改 数据 库 对 象 。 如 果 你 的 DBM 提供 这 样 的 接口 ， 你 可 能 不 需要 学 习 
DDL 语 法 的 细节 就 能 够 创建 一 个 物理 数据 库 。 我 不 向 DBA 推 荐 这 种 方法 ， 因 为 有 时 候 图 形 界面 不 支持 每 个 数据 库 对 象 的 所 有 语 
法 和 选项 。 有 消息 根据 的 DBA 是 一 个 有 效 的 DBA: 除非 你 验证 该 图 形 界面 支持 每 一 个 DDL 选 项 ， 否 则 建议 你 学 习 和 使 用 DDL 语 
I. 


4.6 ”时 仿 数 据 支持 


存储 和 访问 非 流动 数据 是 某 些 类 型 的 应 用 程序 的 共同 需求 。 许 多 类 型 的 数据 都 随时 间 变 化 ， 并 且 不 同 的 用 户 和 应 用 程序 访问 
该 数据 需求 的 时 间 也 不 同 。 一 些 人 认为 ， 最 新 的 数据 就 足够 了 。 但 对 于 另 一 些 人 来 说 ， 必 须 能 够 访问 数据 的 早期 版 本 。 


在 传统 的 关系 数据 库 系 统 中 ， 有 多 种 方法 可 用 于 存储 和 访问 时 态 数据 。 独 立 的 历史 记录 表 是 方法 之 一 (或许 使 用 触发 器 增 
强 ) ;快照 表 是 另 一 种 方法 ; 还 有 一 种 方法 是 量 身 定制 表 和 查询 的 时 间 敏 感性 。 这 些 方法 中 没有 一 种 是 理想 的 ， 尤 其 没有 能 符合 
业务 的 快 节奏 的 方法 ， 也 没有 符合 法 律 法 规 和 监管 日 益 提高 的 需求 的 方法 。 许 多 应 用 需要 提供 非 流动 数据 的 实时 访问 。 


传统 的 数据 库存 储 当 前 有 效 的 数据 ， 它 不 跟踪 过 去 或 未 来 数据 的 状态 。 但 是 ， 一 些 数据 库 系 统 (例如 ，DB2 for z/OS) 3z 
持 内 置 时 态 功能 。 时 态 的 支持 使 得 它 可 以 存储 不 同 的 数据 库 状 态 ， 并 为 这 些 不 同 的 状态 来 查询 数据 。 这 通过 给 数据 附加 一 个 时 间 
段 来 实现 ， 指 出 它 在 数据 库 中 何 时 有 效 或 何 时 发 生变 更 。 


4.6.1 时 态 的 例子 


假设 一 家 保险 公司 向 客户 销售 保险 单 。 任 何 具体 的 保险 单条 款 在 一 段 时 间 内 都 是 有 效 的 。 过 了 那 段 时 间 ， 客 户 可 以 选择 拒绝 
将 来 的 保险 项 目 ， 继 续 使 用 现 有 的 保险 项 目 ， 或 修改 其 保险 项 目的 条 款 。 因 此 ， 在 任何 特定 的 时 间 点 ， 客 户 的 保险 单条 款 都 是 不 
同 的 。 


随 着 时 间 推 移 ， 客 户 根据 自己 的 保险 单 进行 索赔 。 理 赔 信息 需要 人 存储 、 管 理 和 分 析 。 客 户 的 事故 历史 记录 也 是 很 重要 的 具有 
时 态 元 素 的 数据 。 


现在 假设 的 复杂 性 在 于 ， 不 但 试图 开发 一 个 满足 不 断 变化 的 保险 单 、 索 赔 、 历 史 细 节 的 数据 库 设计 ， 而 且 还 要 开启 让 用 户 能 
在 一 个 给 定 的 时 间 点 访问 客户 的 保险 项 目的 查询 功能 。 换 句 话说 ， 比 如， 在 2012 年 4 月 15 日 ， 什 么 样 的 保险 单 对 该 客户 是 有 效 
的 ?或 者 客户 保险 期 间 的 任何 其 他 日 期 ? 


此 业务 时 间 的 概念 可 以 变 得 相当 复杂 。 假 设 情 况 是 ， 一 个 客户 有 多 个 到 期 日 不 同 的 保险 单 。 添 加 保险 项 目 失效 期 间 的 可 能 
性 。 数 据 库 不 保持 静态 ， 它 变 得 更 大 ， 查 询 变 得 更 加 复杂 等 。 


保险 只 是 一 个 例子 。 还 有 许多 其 他 类 型 的 应 用 程序 的 例子 ， 例 如 ， 财 务 应 用 程序 、 信 用 记录 、 人 事 管理 、 运 输 应 用 程序 、 预 
订 系 统 和 医疗 信息 管理 等 。 


4.6.2 ”业务 时 间 和 系统 时 间 


时 态 数据 是 另 一 个 可 能 需要 考虑 的 概念 。 与 业务 时 间 不 同 ， 你 可 能 需要 跟踪 和 管理 系统 时 间 。 例 如 ， 监 管 命令 可 能 需要 你 跟 
踪 一 个 特定 数据 块 的 任意 变更 。 对 个 人 识别 信息 (PI) ， 这 个 现象 很 常见 ， 如 社会 安全 号 码 或 电话 号 码 。 支 持 管理 系统 的 变 
更 ,使 用 户 能 够 在 一 个 时 间 点 查询 数据 库 ， 返 回 那 个 时 间 段 的 数据 的 值 。 


业务 时 间 表 示 数 据 是 准确 的 时 间 段 。 系 统 时 间 表 示 ， 在 此 期 间 数据 被 存储 在 数据 库 中 。 对 一 个 单一 的 数据 块 ， 这 两 个 时 间 段 
不 需要 相同 。 例 如 ， 假 设 你 想 要 存储 20 世 纪事 件 的 时 态 信息 。 这 些 数 据 的 有 效 业 务 时 间 是 1900 年 到 1999 年 。 但 是 ， 如 果 你 现在 
将 这 些 信息 添加 到 数据 库 ， 或 许 数据 的 有 效 系统 时 间 将 在 2013 年 的 某 个 点 上 。 所 以 ， 你 可 能 需要 在 同一 个 表 中 同时 支持 业务 时 
间 数 据 和 系统 时 间 数 据 。 这 就 是 所 谓 的 双 时 态 支 持 。 


因此 ， 术 语 的 更 精确 的 定义 是 : 业务 时 间 (也 称 为 有 效 时 间或 应 用 时 间 ) 指定 存储 在 数据 库 中 的 数据 在 现实 世界 有 效 的 时 
间 。 这 些 都 是 与 数据 打交道 的 业务 用 户 感 兴趣 的 日 期 。 业 务 时 间 应 只 与 有 时 态 跟踪 的 业务 需要 的 数据 联系 在 一 起 。 


系统 时 间 (也 称 为 事务 处 理 时 间 ) 表示 在 数据 库 中 事实 变 成 当前 的 时 间 。 系 统 时 间 可 以 用 来 跟踪 数据 的 插入 和 修改 历史 。 与 
业务 时 间 不 同 ， 事 务 处 理 时 间 可 以 与 任何 数据 库 实 体 联 系 在 一 起 。 根 据 监管 或 行业 的 要 求 ， 它 可 以 跟踪 任何 特定 数据 块 在 什么 时 
候 发 生变 化 。 当 然 ， 你 可 能 不 希望 对 所 有 数据 都 加 上 系统 时 间 ， 因 为 这 样 做 的 开销 很 大 。 


双 时 态 表 是 用 系统 周期 和 业务 周期 定义 的 。 使 用 双 时 态 表 ， 可 以 保持 业务 (或 应 用 程序 ) 的 信息 和 基于 系统 的 历史 信息 。 
对 DBA 的 影响 


实施 数据 库 之 前 ，DBA 必 须要 先 了 解数 据 库 的 时 态 需 求 。DBA 应 使 用 DBMS 内 置 的 工具 来 正确 实施 业务 和 系统 时 间 。 完 成 
此 步骤 后 ， 使 用 SQL 的 As OF 语法 就 可 以 很 容易 地 编写 时 态 查 询 。 例 如 ， 考 虑 关于 跟踪 客户 2012 年 4 月 15 日 生效 的 保险 单 的 讨 


论 。 对 于 时 态 数据 库 ， 使 用 类 似 于 下 面 的 SQL 就 可 以 做 到 : 


SELECT CustName, PolicyNo, BenefitSummary 
FROM InsurancePolicy 

FOR BUSINESS_TIME AS OF '2012-04-15' 
WHERE CustNo = ? 


修改 时 态 数据 需要 使 用 标准 的 INSERT、UPDATE 和 DELETE 语 句 ， 但 你 必须 了 解 时 态 方 面 的 变化 。 对 于 INSERT 语 句 ， 必 须 
正确 操作 日 期 范围 。 对 于 DELETE 语 句 ， 必 须 确保 删除 的 是 正确 的 范围 。 使 用 时 间 从 句 增 强 UPDATE 语 句 ， 这 样 特定 的 范围 就 会 
被 修改 。 


当然 ， 如 果 DBMS 不 提供 时 态 支 持 ，DBA 和 应 用 程序 团队 将 需要 建立 包括 生效 日 期 的 表 ， 并 确保 创建 应 用 程序 代码 来 适当 修 
改 时 间 跨 度 。 此 外 ， 表 的 查询 变 得 更 加 复杂 ， 需 要 BETWEEN 或 大 于 /小 于 日 期 范围 的 谓词 。 


有 关 时 态 数据 的 讨论 很 简短 。 如 果 需 要 了 解 更 详细 的 信息 ， 请 参阅 Johnston 和 Weis 的 《Managing Time in Relational 
Databases) , 


4.7 小 结 


应 将 逻辑 数据 模型 作为 设计 和 创建 物理 数据 库 的 蓝本 。 但 创建 物理 数据 库 不 能 使 用 简单 的 逻辑 到 | 物理 的 映射 。 实 施 物理 数据 
库 结构 之 前 ，DBA 需 要 制定 许多 物理 设计 的 决策 。 很 多 时 候 ， 这 将 偏离 逻辑 数据 模型 。 但 是 ， 这 种 偏离 必须 基于 深入 的 DBMS 知 
识 和 数据 库 将 存在 的 物理 环境 。 


48 ”回顾 


1. 请 描述 将 逻辑 数据 模型 转化 为 物理 数据 库 的 简单 步 又。 

2. 非 规范 化 物理 数据 模型 的 唯一 原因 是 什么 ? 

3. 在 什么 情况 下 应 考虑 位 图 索引 ， 而 不 是 B-tree 索 引 ? 

4. 哪 些 类 型 的 数据 访问 将 从 数据 集群 中 受益 ? 

5. 请 前 述 创建 数据 库 视 图 的 五 个 原因 。 

6. 通 过 在 从 属 表 中 指定 一 个 一 一 码 来 创建 参照 约束 ， 指 向 父 表 的 主 码 。 
7. 请 描述 关系 型 数据 库 使 用 索引 的 方式 。 

8. 表 的 列 的 创建 顺序 为 什么 对 物理 数据 库 设计 很 重要 ? 

9. 什 么 时 候 应 该 考虑 在 数据 库 中 物理 存储 导出 的 数据 ? 


10. 如 果 索 引 有 益 于 性 能 ， 为 了 安全 起 见 ， 为 什么 不 创建 所 有 可 能 的 索引 ? 


附加 问题 


查看 如 图 4-5 所 示 的 小 型 数据 模型 ， 并 为 你 所 选择 的 DBMS 创 建 一 个 物理 数据 库 实 现 。 假 设 有 大 约 25000 名 学 生 ， 每 个 学 生 
每 学 期 有 3~ 5 门 课程 。 最 常见 的 查询 要 求 是 ， 学 生 可 以 创建 自己 的 课程 安排 。 一 定 要 阐明 每 个 物理 设计 决策 ， 并 创建 示例 DDL 语 
句 来 执行 基本 的 物理 设计 。 此 外 ， 指 出 制定 物理 设计 决策 的 哪些 地 方 需要 额外 的 信息 ， 并 说 明 原 因 。 
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图 4-5 ”逻辑 数据 模型 
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第 ?和 章 ”应 用 程序 设计 


应 用 程序 设计 不 仅 是 在 应 用 程序 中 编写 高 效 的 数据 库 请 求 。 程 序 编码 的 每 一 个 环节 ， 都 会 影响 应 用 程序 的 可 用 性 和 有 效 性 。 
当然 ， 应 用 程序 设计 会 涉及 一 些 数据 库 问 题 ， 如 用 传统 的 编程 语言 与 SQL 交互 以 及 使 用 的 SQL 类 型 。 但 是 ， 每 个 应 用 程序 的 设计 
都 必须 确保 它 所 修改 的 数据 的 完整 性 。 此 外 ， 设 计 过 程 中 必须 要 考虑 性 能 因素 。 


设计 过 程 中 必须 要 考虑 性 能 因素 。 


位 于 最 前 沿 的 DBA 必 须 在 深入 了 解数 据 库 的 基础 之 上 ， 推 广 应 用 程序 设计 的 概念 。 程 序 员 只 管 设计 和 编写 应 用 程序 ， 而 不 
考虑 这 些 程序 与 数据 库 交 互 时 将 如 何 执行 ， 这 是 不 能 接受 的 。 一 些 不 正规 的 企业 没有 预先 经 过 性 能 工程 就 迫不及待 着 手数 据 库 应 
用 程序 的 开发 ， 因 为 它们 假定 ，DBA 开 发 完成 后 ， 任 何 性 能 问题 都 可 以 得 到 解决 。 但 是 ， 一 个 设计 不 当 的 应 用 程序 不 可 能 仪 通 
过 调整 而 不 重 写 就 可 以 解决 问题 。 那 么 ， 为 什么 不 在 第 一 次 就 编写 正确 ? 


本 章 的 目的 不 是 介绍 软件 开发 方法 或 提供 编程 方面 的 深入 论述 ， 也 不 是 重点 讨论 SQL。 讨 论 的 焦点 是 ， 编 写 使 用 永久 数据 存 
储 数据 库 的 应 用 程序 时 ， 需 要 明白 更 高 层次 的 应 用 程序 设计 问题 。 所 有 DBA 都 应 该 了 解 本 章 涉及 的 概念 ， 并 能 有 效 地 传达 给 
所 在 企业 的 开发 人 员 ，。 


第 12 章 详细 介绍 了 各 种 应 用 程序 的 性 能 问题 ， 因 为 它们 涉及 数据 库 的 开发 。 


5.1 ”数据 库 应 用 程序 开发 和 SQL 


设计 合适 的 数据 库 应 用 程序 系统 是 一 项 复杂 而 耗 时 的 任务 。 在 应 用 程序 设计 期 间 做 出 的 任何 选择 ， 都 会 对 最 终 交 付 的 应 用 程 
序 的 实用 性 产生 影响 。 事 实 上 ， 设 计 和 编码 不 当 的 应 用 程序 ， 如 果 效 率 低 下 、 无 效 或 不 容易 使 用 ， 就 可 能 需要 从 头 开始 重新 设计 
和 重新 编码 。 


设计 合适 的 数据 库 应 用 程序 系统 是 一 项 复杂 的 任务 。 
要 正确 地 设计 一 个 依赖 永久 数据 存储 数据 库 的 应 用 程序 ， 系 统 设计 师 至 少 需要 了 解 以 下 问题 : 
. 数据 将 如 何 存 储 在 关系 数据 库 中 。 
> 如 何 编 码 SQL 语 句 米 访问 和 修改 数据 库 中 的 数据 。 
. SQL 如 何不 同 于 传统 的 编程 语言 。 
» 如 何 将 SQL 语句 嵌入 主机 编程 语言 。 
» 如 何 通过 改变 SQL 和 索引 来 优化 数据 库 访 问 。 
通过 编程 的 方法 ， 避 免 潜 在 的 数据 库 处 理 问题 。 


一 般 情 况 下 ， 开 发 人 员 必 须 使 应 用 程序 开发 语言 和 工具 与 物理 数据 库 设 计 和 DBMSs 的 功能 相 匹配 。 第 一 项 任务 是 要 掌握 复杂 
的 SQL。 


5.1.1 SQL 


结构 化 查询 语言 (SQL) 是 用 于 访问 关系 数据 库 的 事实 标准 。 所 有 RDBMS 产 品 ， 甚 至 一 些 非 关系 型 DBMS 产 品 ， 都 使 用 
SQL 来 操作 数据 。 


SQL 是 用 于 访问 关系 数据 库 的 事实 标准 。 


为 什么 SQL 在 关系 型 数据 访问 界 如 此 普遍 ? SQL 成 功 的 原因 有 很 多 。 最 重要 的 是 ，SQL 是 一 种 高 级 语言 ， 与 传统 的 程序 语言 
相 比 ， 它 提供 了 更 大 程度 的 抽象 。 第 三 代 语 言 (如 COBOL 和 C) ， 甚 至 第 四 代 语 言 ， 通 常 需要 程序 员 浏 览 数 据 结构 。 必 须 编写 
程序 逻辑 ， 使 其 按照 应 用 程序 员 或 系统 分 析 师 确定 的 顺序 逐个 记录 数据 存储 。 这 一 信息 由 高 级 语言 编写 ， 并 且 一 旦 编写 完成 ， 就 
很 难 更 改 。 


与 此 相反 ，SQL 由 程序 员 指 定 设 计 需 要 的 数据 。 但 它 (的 确 ) 不 能 指定 如 何 检索 。SQL 编 写 时 没有 嵌入 式 数 据 导航 指令 。 


DBMS 对 每 个 SQL 语句 进行 分 析 ， 并 在 “幕后 ”制定 数据 导航 指令 。 这 些 数据 导航 指令 通常 称 为 访问 路 径 。 通 过 授权 DBMS 确 定 
最 佳 的 数据 访问 路 径 ， 减 轻 了 程序 员 的 沉重 负担 。 因 为 DBM S 更 了 解 所 存储 数据 的 状态 ， 所 以 可 以 产生 更 有 效 且 动态 的 数据 访问 
路 径 。 其 结果 是 ，SQL (如 果 使 用 得 当 ) 可 以 提供 比 相应 的 高 级 语言 更 快 的 应 用 程序 开发 和 原型 环境 。 此 外 ， 当 数据 特点 和 访问 
模式 变更 时 ，DBMS 可 以 变更 SQL 查询 的 访问 路 径 ， 而 无 需 以 任何 方式 变更 实际 的 SQL。 


SQL 指定 需要 的 数据 类 型 而 不 是 如 何 检索 。 
但 不 容 争辩 的 是 ， 巩 固 SQL 成 功 的 一 个 最 重要 的 功能 是 其 使 用 类 似 英语 的 语法 来 检索 数据 。 这 样 理解 如 下 的 查询 : 


SELECT deptnum, deptname 
FROM dept 
WHERE supervisornum = '903'; 


会 比 了 解 一 页 页 的 C 或 BASIC 源 代码 容易 得 多 ， 更 不 用 说 古老 的 汇编 指令 了 。 因 为 SQL 编 程 指令 更 容易 理解 ， 学 起 来 也 更 容 
易 ， 而 且 也 便于 维护 ， 所 以 可 以 在 较 短 的 时 间 内 为 用 户 和 程序 员 提 供 更 多 的 生产 力 。 但 是 ， 不 要 低估 SQL: 掌握 它 的 复杂 性 并 不 


容易 ， 需 要 大 量 的 学 习 和 实践 。 


SQL 还 采用 了 自由 形式 的 结构 ， 这 使 得 它 非常 灵活 。SQL 程 序 员 能 够 以 最 适合 的 方式 为 既定 用 户 开 发 SQL 语句 。 在 检查 语法 
和 优化 请 求 之 前 ，DBMS 要 对 每 个 SQL 请 求 进行 解析 。 因 此 ，SQL 语 句 不 需要 在 任何 给 定 的 列 开始 ， 它 可 以 串 成 一 行 或 分 成 几 
行 。 例 如 ， 下 面 的 SQL 语句 : 


SELECT deptnum，deptname FROM dept WHERE supervisornum = '903'; 


完全 等 同 于 前 面 提 到 的 SQL 语句 。 有 关 SQL 灵 活性 的 另 一 个 例子 是 ， 程 序 员 可 以 使 用 多 种 不 同 且 功能 等 同 的 方法 指定 一 个 请 
求 ， 这 一 功能 对 SQL 新 手 来 说 非常 容易 混淆 。 此 外 ，SQL 的 灵活 性 并 不 总 是 可 取 的 ， 因 为 不 同 但 逻辑 等 同 的 SQL 公式 可 能 会 导 
不 同 的 性 能 结果 。 有 关 示 例 ， 请 参阅 “连接 与 子 查询 ”。 


最 后 ， 使 用 SQL 的 最 大 好 处 之 一 是 其 能 够 在 单个 代码 行 上 操作 数据 集 。 使 用 单个 SQL 语句 可 以 进行 多 行 检 索 、 修 改 或 删除 。 
此 功能 为 SQL 开发 人 员 提 供 了 很 大 的 权力 ， 但 也 限制 了 SQL 的 整体 功能 。 只 使 用 SQL 而 不 使 用 其 多 行 循环 或 一 次 处 理 多 行 的 功 
能 ， 某 些 任 务 就 不 可 能 完成 。 当 然 ， 随 着 越 来 越 多 的 功能 添加 到 SQL， 单 独 使 用 SQL 编码 就 可 以 完成 的 任务 数量 正在 增加 。 例 
如 ， 可 以 使 用 SQL 创建 一 个 存储 过 程 ， 执 行 以 前 由 传统 编程 语言 完成 的 许多 编程 任务 。 此 外 ， 大 多 数 流行 的 天 系 DBM 产品 都 支 
寺 具 有 程序 能 力 的 SQL 扩展 版 本 。 表 5-1 列 出 了 最 流行 的 程序 SQL 语言 。 


表 5-1 SQL 使 用 注意 事项 


DBMS 程序 SQL 方言 
Oracle PL/SQL 
Microsoft SQL Server Transact-SQL 
Sybase Adaptive Server Enterprise Transact-SQL 
DB2 SQL Procedure Language 
连接 与 子 查询 


举 个 SQL 灵活 性 的 例子 ， 一 个 语句 可 以 使 用 各 种 方法 访问 多 个 表 中 的 数据 。SQL 提供 了 两 种 方法 : 连接 和 子 查询 。 然 而 ， 子 
查询 可 以 转换 为 等 效 连 接 。 这 两 种 查询 类 型 背后 的 概念 是 : 根据 与 表 的 数据 相 匹配 的 搜索 标准 ， 从 多 个 表 中 检索 数据 。 


考虑 以 下 两 个 SQL 语句 。 第 一 个 是 子 查询 ， 其 查询 能 入 在 另 一 个 查询 中 。 第 二 个 是 连接 ， 其 中 两 个 表 在 SELECT 语句 的 


FROM 子 句 中 指定 。 


SELECT empno, firstname, lastname 
FROM emp loyee 
WHERE workdept IN 

(SELECT deptno 

FROM department 

WHERE deptname = ‘DBA’); 
SELECT empno, firstname, lastname 
FROM employee, 


department 
WHERE workdept = deptno 
AND deptname = ‘DBA’; 


这 两 个 查询 都 返回 数据 库 管 理 部 门 的 员工 信息 。 这 两 个 查询 返回 的 结果 是 相同 的 ， 但 根据 使 用 的 DBMS ， 以 及 为 每 个 表 定 义 
的 索引 和 查询 本 身 的 复杂 性 ， 它 们 的 性 能 可 能 有 很 大 的 不 同 。 


5.1.2 Set-at-a-Time 处 理 和 关系 闭 包 


在 关系 数据 库 上 执行 的 每 个 操作 ， 都 是 操作 在 一 个 表 (或 表 集 ) 上 ， 却 影响 了 另 一 个 表 。 此 功能 称 为 关系 数据 库 的 关系 闭 
包 。 所 有 SQL 数据 处 理 操 作 ( 即 SELECT、INSERT、UPDATE、DELETE 语 句 ) 都 在 集 级 水 平 进行 。 一 个 检索 语句 可 以 返回 多 
行 ， 一 个 修改 语句 可 以 修改 多 行 。 


所 有 SQL 数据 处 理 操作 都 在 集 级 水 平 进行 。 


为 阐明 关系 闭 包 这 一 概念 ， 请 参阅 图 ?5-1。 数 据 库 用 户 可 以 发 起 SQL 请 求 。 每 个 SQL 语句 可 以 访问 数据 库 中 一 个 或 多 个 表 。 
将 SQL 语句 发 送 到 DBMS， 于 是 就 可 以 分 析 、 优 化 和 执行 查询 。DBM 指定 数据 的 访问 路 径 ， 每 当 完 成 一 个 请 求 时 ， 所 需 的 信息 
以 一 组 列 和 行 ( 换 句 话说 ， 一 个 表 ) 呈现 给 用 户 。 结 果 将 包括 一 列 / 行 或 多 列 / 行 0 和 1。 因 为 SQL 执行 集 级 处 理 ，DBMS 操 作 一 组 
数据 ， 返 回 结果 总 是 一 组 数据 。 当 然 ， 结 果 集 可 以 为 空 ， 或 它 可 以 只 包含 一 行 或 一 列 。 关 系 模型 和 集 级 处 理 基 于 集合 论 的 数学 规 
律 ， 人 允许 空 集 和 单 值 集 。 


使 用 关系 数据 库 时 ， 由 于 SQL 的 set-at-a-time 性 质 ， 应 用 程序 开发 人 员 面 临 一 个 潜在 的 问题 。 大 多 数 编程 语言 对 数据 的 操 
作 都 是 一 次 一 条 记录 。 但 是 ， 如 果 某 个 程序 需要 关系 数据 ， 它 必须 使 用 SQL 来 请 求 数据 。 这 将 造成 阻抗 不 匹配 。 程 序 希 望 数据 一 
次 返回 一 行 ， 但 SQL 一 次 返回 一 组 数据 。 根 据 DBMS、 编 程 语言 和 环境 ， 解 决 这 个 不 匹配 的 方法 各 不 相同 。 大 多 数 DBMS 产 品 提 
供 一 个 称 为 光标 的 功能 ,接受 来 自 5QL 请 求 的 输入 ， 并 提供 一 种 机 制 来 获取 结果 集 的 个 别 行 。 一 些 编程 环境 和 第 四 代 语 言 与 
DBMS 通 信 时 ， 可 以 自动 将 多 行 集 转 换 为 单行 。 


数据 库 表 


图 5-1 关系 闭 包 


此 外 ， 大 多 数 程序 员 习 惯 将 数据 导航 指令 强加 入 程序 。SQL 指 定 要 检索 什么 ， 而 不 是 如 何 检索 。DBM 决定 如 何 最 好 地 检索 
数据 。 不 习惯 数据 库 处 理 的 程序 员 ， 不 经 过 一 些 训练 就 不 可 能 掌握 这 个 概念 。 无 论 如 何 ， 需 要 为 程序 员 提供 培训 ， 让 他 们 了 解 这 
些 数据 库 和 非 数据 库 编程 技术 之 间 的 高 层次 差异 。 这 个 工作 通常 落 在 DBA 或 企业 内 其 他 技术 娴熟 的 数据 库 技术 人 员 身 上 。 当 
然 ， 数据库 程序 员 需 要 知道 的 还 有 更 多 较 低层 次 的 细节 ， 如 SQL 语 法 、 调 试 和 测试 方法 、 优 化 技术 和 程序 准备 程序 (汇编 、 绑 定 


等 ) 。 


DBMS 决 定 如 何 最 好 地 检索 数据 。 


5.1.3 ”在 程序 中 肉 入 SQL 语 


要 使 用 SQL 与 数据 库 进 行 通信 ， 大 多 数 数据 库 应 用 程序 都 需要 一 种 主机 编程 语言 。SQL 可 以 使 用 的 编程 语言 范围 很 广 ， 从 传 
统 的 语言 ， 如 COBOL、FORTRAN、 汇 编 到 更 现代 的 语言 ， 如 C/C++、Java、PHP 和 Visual Basic。 主 机 编程 语言 的 选择 可 能 会 
影响 SQL 编码 方式 。 例 如 ，SQL 直 接 散 入 COBOL 程 序 ， 而 语言 如 C 则 需要 一 个 API (ODBC) 发 出 SQL 语句 。 


你 的 公司 很 可 能 会 将 开发 语言 的 选择 限制 为 几 个 。 你 应 该 试 着 尽量 减少 所 使 用 的 语言 的 数量 ， 因 为 这 会 使 应 用 程序 的 支持 和 
维护 更 加 容易 。 此 外 ， 这 样 的 限制 也 使 DBA 管 理 和 优化 数据 库 环 境 更 加 容易 。DBA 应 该 能 够 阅读 和 了 解 用 于 访问 企业 内 所 有 数 
据 库 的 每 种 语言 的 程序 代码 。 


尽量 减少 所 使 用 的 语言 的 数量 。 


某 些 应 用 程序 开发 计划 使 用 IDE (集成 开发 环境 ) 或 代码 生成 器 ， 根 据 程 序 规范 来 创建 程序 。 谦 慎 采 取 这 种 方法 : 先 测试 代 
码 生 成 器 的 有 效 性 ， 然 后 再 使 用 其 创建 SQL。 使 用 代码 生成 工具 ， 可 能 会 导致 性 能 低下 ， 因 为 这 些 工具 并 不 了 解 你 所 使 用 的 
DBMS。 大 多 数 情况 下 ， 代 码 生成 器 的 设计 适用 于 多 个 DBMSs 产 品 ， 因 此 不 会 为 了 方便 它们 中 的 任何 一 个 而 进行 优化 。 测 试 生成 


的 SQL， 再 将 程序 移动 到 生产 环境 ， 如 果 有 必要 ， 还 要 修改 生成 的 SQL， 或 建立 索引 来 优化 它 。DBA 应 该 专门 实施 一 个 程序 ， 来 
测试 SQL 的 性 能 。 


5.1.4 ” SQL 中间 件 和 API 


应 用 程序 需要 一 个 接口 发 出 SQL 来 访问 或 修改 数据 。 该 接口 用 于 将 SQL 语句 嵌入 主机 编程 语言 ， 如 COBOL、Java、( 或 
Visual Basic。 标 准 接口 使 应 用 程序 能 够 使 用 SQL 访问 数据 库 。 进 行 数 据 库 编程 常用 的 几 个 标准 接口 或 API 包 括 ODBC、JDBC、 
SQU 和 QOLE DB, 


其 中 最 流行 的 SQL API 之 一 是 开放 式 数据 库 连 接 (ODBC) 。ODBC 不 是 直接 在 程序 中 说 入 SQL， 而 是 使 用 可 调用 程序 。 
ODBC 提 供 程序 分 配 和 释放 资源 ， 控 制 到 数据 库 的 连接 ， 执 行 SQL 语句 ， 获 取 诊 断 信 息 ， 控 制 传输 终止 ， 并 获得 有 关 执 行 的 信 
息 。ODBC 基 本 上 是 一 个 调用 级 接口 (CLI) ， 与 数据 库 进 行 交互 。CLIl 通 过 使 用 过 程 调 用 ， 对 数据 库 发 出 SQL 语 句 ， 而 不 是 直接 
嵌入 SQL 语句。 


ODBC 基 本 上 是 一 个 调用 级 接口 (CLI) ， 与 数据 库 进 行 交 互 。 


Microsoft 发 明 的 ODBC 接 口 ， 使 关系 数据 库 能 够 访问 Microsoft Windows 编 程 。 然 而 ，ODBC 已 经 成 为 SQL 编程 的 一 个 行 
业 标 准 CLI。 事 实 上 ， 今 天 每 个 主要 的 DBMS 都 支持 ODBC。 


ODBC 依 赖 驱 动 程序 ， 为 特定 DBMS 操 作 而 优化 的 ODBC 接 口 。 程 序 可 以 使 用 ODBC 驱 动 程序 与 任何 兼容 ODBC 的 数据 库 进 
行 通信 。ODBC 驱 动 程序 可 以 使 任何 Windows 应 用 程序 中 的 标准 SQL 语 句 集 翻 译 为 远程 兼容 SQL 的 数据 库 可 以 识别 的 命令 。 


另 一 个 流行 的 SQL APl 是 Java 数 据 库 连 接 (JDBC) 。JDBC 使 Java 能 够 访问 关系 数据 库 。 与 ODBC 类 似 ，JDBC 包 含 一 组 可 用 
于 访问 关系 数据 的 类 与 接口 。 有 几 种 类 型 的 JDBC 中 间 件 ,包括 JDBC-to-ODBC 桥 ， 以 及 直接 通过 JDBC 连 接 到 关系 数据 库 。 任 
何 熟悉 应 用 程序 编程 和 ODBC (或 任何 cal-level 接 口 ) 的 人 都 可 以 迅速 运行 JDBC (有 关 不 同类 型 的 JDBC 驱 动 程序 ， 请 参阅 第 21 


章 ) 。 


通过 Java 程 序 访问 数据 库 的 另 一 种 方式 是 使 用 SQU。SQUJ 使 开发 人 员 能 够 直接 在 Java 程 序 中 嵌入 SQL 语 句 ， 从 而 为 Java 提 
供 静 态 SQL 支 持 。 预 编译 器 将 嵌入 的 SQL 转 换 成 java 代 码 。 然 后 将 这 些 Java 程 序 编译 成 字 节 码 ， 并 且 数 据 库 绑 定 操作 为 SQL 创 建 
用 于 打包 访问 的 例 程 。 


SQIJ 使 开发 人 员 能 够 在 Java 程 序 中 嵌入 SQL 语 各 。 


OLE DB (代表 对 象 链接 和 嵌入 数据 库 ) 是 一 个 基于 COM 架 构 的 接口 。 它 是 一 个 低级 别 的 数据 接口 。OLE DB 提供 的 应 用 程 
序 ， 可 以 统一 访问 存储 在 不 同 信息 源 中 的 数据 。 它 比 ODBC 更 加 灵活 ， 因 为 它 可 以 用 来 访问 关系 型 和 非 天 系 型 数据 。OLE DB 为 
通用 数据 访问 提供 了 一 个 面向 对 象 的 接口 。OLE DB 的 概念 分 为 消费 者 和 提供 考 。 消 费 者 是 需要 访问 数据 的 应 用 程序 ， 提 供 者 是 
执行 接口 的 软件 组 件 ， 并 为 消费 者 提供 数据 。 


SQL Server 2012 [是 计划 包含 SQL Server 的 OLE DB 提供 者 的 最 后 一 个 版 本 。 但 是 ，Microsoft 已 经 表示 ， 将 至 少 继续 支 
持 7 年 。 


COM 是 Microsoft 基 于 组 件 的 开发 架构 。 使 用 COM ， 开 发 人 员 可 以 创建 应 用 程序 组 件 ， 这 些 组 件 可 以 组 合 在 一 起 创建 应 用 
程序 系统 。 它 们 可 以 由 不 同 的 开发 人 员 编 写 ， 并 且 不 一 定 使 用 相同 的 编程 语言 。ADO (ActiveX 数 据 对 象 ) 是 一 组 软件 组 件 ， 程 
序 员 可 以 用 它 来 访问 数据 和 数据 服务 。 


COM 和 ADO 都 早 于 .NET 框 架 ， 但 改良 后 可 以 供 .NET 使 用 。 


[1] AY KMicrosoft MOLE DB 转 为 ODBC 的 信息 可 以 参阅 : 


http://social.technet.mictosoft.com/Forums/en/sqldataaccess/thread/e696d0ac-f8e2-4b19-8a08-7a357d3d780f。 


5.1.5 ”应 用 程序 基础 架构 


应 用 程序 基础 架构 是 支持 和 使 用 应 用 程序 的 硬件 和 软件 环境 的 组 合 。 每 个 企业 的 应 用 程序 基础 架构 都 互 不 相同 ， 甚 到 在 一 个 
企业 内 每 个 应 用 程序 的 基础 架构 也 互 不 相同 。 应 用 程序 基础 架构 为 构建 、 部 署 和 管理 应 用 程序 提供 了 高 性 能 、 安 全 性 和 控制 基 
础 。 


从 硬件 角度 看 ， 应 用 程序 基础 架构 包括 服务 器 、 客 户 端 和 网 络 组 件 。 从 软件 角度 看 ， 事 情 有 点 难 定 。 应 用 程序 基础 架构 的 软 
件 组 件 可 以 包括 数据 库 服务 器 、 应 用 程序 服务 器 、Web 服 务 器 、 事 务 管理 程序 和 开发 框架 。 应 用 程序 基础 架构 的 一 些 天 键 功能 
包括 事务 管理 、 集 群 、 可 靠 的 应 用 程序 到 应 用 程序 的 消息 、 系 统管 理 、 先 进 的 应 用 程序 开发 工具 、 专 有 访问 和 与 传统 技术 的 互 操 
作 性 。 


从 大 型 机 角度 看 ， 应 用 程序 基础 架构 可 能 包括 1BM z 系 列 硬件 上 运行 的 z/OS、DB2、CICS 和 COBOL 编 写 的 应 用 程序 。 通 
常 ， 应 用 程序 包括 批 处 理 和 联机 工作 负载 。 现 代 大 型 机 基础 架构 增加 了 连接 非 大 型 机 客户 端 以 及 Websphere Application 
Server 和 Java 程 序 的 接口 。 大 多 数 新 的 大 型 机 开发 使 用 IDE 来 编写 现代 的 应 用 程序 ， 而 不 是 依靠 COBOL 程 序 员 。 


大 多 数 现代 、 分 布 式 、 非 大 型 机 应 用 程序 的 开发 项 目 通常 依赖 应 用 程序 开发 框架 。 最 常用 的 两 种 框架 是 Microsoft NET 和 
J2EE。 


.NET 


Microsoft.NET 框 架 为 创建 、 部 署 和 管理 应 用 程序 提供 了 一 个 全 面 的 开发 平台 。.NET 框 架 为 使 用 通用 基础 构建 组 件 提供 了 
CLR (公共 语言 运行 时 间 ) 和 类 库 。 这 为 开发 人 员 提 供 了 便利 ， 如 支持 标准 实践 、 可 扩展 性 和 紧密 集成 的 开发 工具 集 。 
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图 5-2” .NET 框架 


除了 CLR 和 类 库 ，.NET 框 架 还 包括 多 个 主要 的 组 件 。 从 数据 角度 看 ， 最 重要 的 组 件 是 ADO.NET， 它 提供 了 数据 源 的 访问 ， 
如 数据 库 管 理 系 统 。 


参见 图 5-2 中 对 .NET 框 架 和 组 件 的 描述 。 


ADO.NET 由 一 系列 技术 组 成 ， 这 些 技术 使 .NET 开 发 人 员 能 够 通过 标准 化 、 结 构 化 以 及 断 开 的 方式 与 数据 进行 交互 。 使 
用 .NET 类 库 的 应 用 程序 依赖 DLL 文件 中 提供 的 .NET 类 库 。ADO.NET 管 理 内 部 数据 (在 内 存 中 创建 ， 由 程序 使 用 ) 和 外 部 数据 
(在 数据 库 中 ) 。.Net 通 过 其 对 XML 的 使 用 和 支持 ， 提 供 互 操作 性 和 可 维护 性 ， 并 通过 一 个 使 用 强 类 型 数据 的 编程 模型 ， 简 化 
可 编程 序 性 ， 并 且 增 强 性 能 和 可 扩展 性 。 


J2EE 和 Java 


Java 2 平台 企业 版 (J2EE) 是 一 组 协调 的 规范 和 惯例 ， 它 们 一 起 生成 用 于 开发 、 部 署 和 管理 多 层 企 业 应 用 程序 的 解决 方案 。 
J2EE 平 台 通 过 标准 化 、 模 块 化 的 组 件 基础 ， 简 化 了 企业 应 用 。 无 需 复杂 的 编程 ，J2EE 为 这 些 组 件 提供 了 一 整套 服务 ， 并 处 理应 
用 程序 建设 的 许多 细节 。 


因此 ，J2EE 不 完全 是 一 个 软件 框架 ， 而 是 一 套 规范 ， 每 种 规范 都 可 以 决定 各 种 J2EE 功 能 该 如 何 运行 。 符 合 J2EE 平 台 的 软件 
的 优势 包括 : “一 次 编写 ， 随 处 运行 ”的 便携 性 ， 为 数据 库 访问 提供 JDBC AP1， 与 现 有 企业 资源 交互 的 CORBA 技 术 ， 为 数据 保 
护 提 供 安 全 模型 。 在 此 基础 上 ，Java 2 平台 企业 版 ， 增 加 了 对 企业 JavaBeans 组 件 、Java Servlets API、JavasServer 页 面 和 XML 
技术 的 全 面 支 持 。 


图 5-3 描 绘 了 J2EE 实 现 的 示例 。 其 他 J2EE 信 息 和 说 明 可 以 参考 网 址 
http://java.sun.com/j2ee/reference/whitepapers/j2ee_guide.pdf, 
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图 5-3 ”J2EE 实 现 的 示例 
需要 注意 的 是 ，Java 的 内 容 比 本 节 介 绍 的 多 很 多 。 “Java 程 序 类 型 ”简单 介绍 了 几 种 可 以 编码 的 Java 程 序 。 
Java 程 序 类 型 


用 Java 访 问 数据 时 ， 你 可 以 执行 三 种 类 型 的 程序 : Java applet. Java setvlet 和 Java 应 用 程序 。 


Javaapplet 是 一 个 小 的 应 用 程序 ， 必 须 先 下 载 ， 然 后 才能 在 支持 Java 的 Web 浏 览 器 上 运行 。Javaapplet 驻 留 在 Web 服 务 器 端 。 当 
Web 服 务 器 返回 一 个 指向 Java applet 的 HTML 页 面 时 ， 支 持 Java 功 能 的 Web 浏 览 器 请 求 下 载 applet。 浏 览 器 接收 到 applet 后 ， 浏 览 器 内 
部 启动 applet 或 交 由 外 部 JVM 执 行 


Applet 通 常 执行 简单 的 操作 ， 如 编辑 输入 数据 或 控制 屏 互动 ， 并 提供 其 他 客户 端 功 能 。 当 然 ， 可 以 对 Javaapplet 进 行 编码 来 完 
成 更 复杂 的 功能 ， 但 在 客户 端 加 载 并 运行 非 Java 代 码 需 要 签名 的 applet， 因 为 它 有 权限 在 客户 端 运行 代码 。 


性 能 可 能 会 出 现 问题 ， 因 为 Java applet 必 须 下 载 才 可 以 运行 。 下 载 applet 的 时 间 必 须 考虑 到 其 服务 级 别 中 。 一 般 情况 下 ，Java 
applet 很 小 ， 所 以 对 性 能 的 影响 可 以 忽略 不 计 。 然 而 ， 如 果 网 络 有 问题 ， 即 使 很 小 的 下 载 也 会 很 慢 。 可 以 通过 Web 浏 览 器 缓存 Java 
applet， 从 而 减少 对 性 能 的 影响 。 


Java servlet 基 本 上 是 一 个 服务 器 端的 Java。Java servlet 在 Web 服 务 器 上 运行 ， 正 如 applet 在 Web 浏 览 器 上 运行 一 样 。Java servlet 可 
以 用 来 扩展 Web 服 务 器 的 功能 。Web 服 务 器 向 setvlet 发 出 请 求 ，setvlet 回 复 给 它们 。Setvlet 可 以 代替 CGI 应 用 程序 。 


Java setrvlet 比 客户 端的 Javaapplet 更 有 安全 优势 。 防 火 墙 内 部 的 Web 服 务 器 上 运行 servlet 可 以 控制 访问 敏感 数据 和 业务 逻辑 。 
Javaapplet 本 身 不 提供 这 些 安全 功能 


Java 应 用 程序 基本 上 与 任何 其 他 编程 语言 编写 的 程序 相同 。 它 可 以 执行 所 有 与 项 目 有 关 的 任务 ， 包 括 许多 Java applet 无 法 执行 
的 任务 。 而 有 全 ，Java 应 用 程序 不 需要 在 浏览 器 运行 。 它 可 以 在 客户 端 或 服务 器 端的 计算 机 上 运行 


在 选择 使 用 哪 种 Java 开 发 方式 之 前 ， 你 必须 了 解 程序 运行 所 在 的 环境 的 基本 知识 。 决 定 需要 哪 种 类 型 的 Java 程 序 来 满足 开发 


需求 时 ， 先 考虑 以 下 问题 : 
* 程序 将 如 何 运行 ? 必须 在 互联 网 上 作为 一 个 局 域 网 或 外 部 网 的 应 用 程序 运行 ， 还 是 仅 作为 一 个 独立 的 应 用 程序 ? 
- 该 程序 必须 执行 的 业务 逻辑 是 什么 ? 
- 程序 复杂 度 如 何 ? 


. 程序 的 大 小 如 何 ， 是 否 可 以 快速 下 载 ? 


AARP RHR? 以 怎样 的 速度 将 它们 连接 到 Web? 
Java 应 用 程序 、Java applet 和 Java setvlet 本 质 类 似 ， 但 调用 它们 的 方法 不 同 。Java applet 和 setvlet 从 一 个 HIML 页 面 开 始 。Java 应 
用 程序 不 需要 Web 组 件 ， 但 可 以 作为 局 域 网 解决 方案 的 一 部 分 。 


.NET 与 J2EE 


.NET 与 J2EE 平 台 到 底 哪 个 更 有 优势 ， 这 个 话题 的 讨论 一 直 都 没有 停止 过 。 现 实 中 ， 企 业 并 不 是 做 “要 么 /或 ”的 决定 ， 而 
是 “ 既 / 和 ”的 决定 。 昌 然 两 者 都 是 开发 平台 ， 但 两 者 却 不 能 互 换 。 

基本 上 ，.NET 是 一 个 平台 ， 只 要 将 应 用 程序 部 署 在 Windows 上 ， 其 就 可 以 实现 多 语言 开发 。 另 一 方面 ，J2EE 的 设计 使 应 用 
程序 能 够 部 署 到 任何 平台 上 ， 只 要 它们 使 用 Java [1 编写。 显然 ， 企 业 会 根据 部 署 和 实施 要 求 ， 选 择 不 同 的 方法 和 平台 来 开发 不 
同 的 应 用 系统 。 


另 一 个 区 别 是 ，.NET 是 一 个 软件 ， 可 以 从 Microsoft 购 买 。J2EE 是 一 组 规范 (由 Oracle 管 理 ， 前 Sun Microsystems) ， 其 
中 每 组 规范 决定 各 种 J2EE 的 功能 如 何 运行 。IBM 的 Websphere 应 用 服务 器 是 软件 实现 J2EE 的 一 个 例子 。Oracle 不 仅 靠 卖 J2EE 软 
件 赚钱 ， 而 且 还 通过 给 独立 软件 供应 商 授权 J2EE 规 范 ， 然 后 根据 规范 书 执行 软件 来 赚钱 。 


底线 是 .NET 和 J2EE 都 可 用 于 构建 Web 服 务 。Web 服 务 是 一 个 应 用 程序 ， 接 受 来 自 跨 互联 网 (或 局 域 网 ) 的 其 他 系统 的 请 
求 ， 由 轻 量 级 、 供 应 商 中 立 的 通信 技术 调停 。Web 服 务 使 应 用 程序 与 其 他 应 用 程序 共享 数据 和 调用 功能 ， 不 管 其 他 应 用 程序 如 
何 建立 ， 在 什么 操作 系统 或 平台 上 运行 ， 使 用 何 种 设备 访问 。 


Ruby on Rails 


Ruby on Rails 是 Ruby 编 程 语 言 的 开放 源码 Web 应 用 程序 框架 。Ruby on Rails 包 含 能 够 使 常见 的 开发 任务 变 简单 的 工具 ， 
是 一 种 额外 的 应 用 程序 开发 框架 ， 与 .NET 和 J2EE 类 似 但 不 相同 。 


诚然 ， 可 以 用 整 本 书 来 讲述 现代 应 用 程序 开发 都 可 以 选择 哪些 框架 。 但 是 ， 本 书 是 关于 数据 库 管理 的 ， 所 以 本 节 只 提供 一 些 
粗略 的 概述 。 


[1] 将 .NET 应 用 程序 部 署 在 其 他 操作 系统 有 多 种 选择 ， 其 中 一 种 是 Mono (http://www.go-mono.com/mono- 
downloads/download.html) 。 


5.1.6 面向 对 象 与 SQL 


由 于 面向 对 象 (00) 开发 范例 的 声称 优势 ， 许 多 企业 已 经 采用 面向 对 象 (OO) 的 编程 标准 和 语言 。 面 向 对 象 的 主要 优点 
在 于 ， 其 可 以 更 快 地 完成 程序 开发 并 降低 用 于 维护 的 费用 ， 从 而 导致 更 好 的 投资 回报 率 。 按 照 类 似 的 对 象 类 ， 对 可 重用 的 对 象 进 
行 组 合并 定义 新 的 对 象 ， 可 以 大 大 减少 开发 的 时 间 和 成 本 。 


面向 对 象 可 以 导致 更 好 的 投资 回报 率 。 


有 了 这 些 优 点 ， 许 多 IT 企业 接受 面向 对 象 的 编程 和 开发 就 不 难 理解 了 。 从 历史 上 看 ，IT 所 面临 的 最 大 问题 之 一 是 大 量 的 项 目 
待 完成 工作 。 在 许多 情况 下 ， 终 端 用 户 不 得 不 长 时 间 等 待 新 的 应 用 程序 ， 因 为 有 太 多 的 工作 待 完成 ， 而 却 没有 那么 多 的 人 员 来 处 
理 新 项 目 。 这 种 积压 有 时 可 能 会 导致 一 些 令 人 头疼 的 现象 ， 如 业务 人 员 试图 创建 自己 的 应 用 程序 或 购买 第 三 方 打包 的 应 用 程序 
(以 及 由 此 引起 的 所 有 潜在 的 管理 负担 ) 。 所 以 ， 这 就 很 清楚 OO 对 企业 充满 诱惑 的 原因 了 。 


但 是 ， 由 于 OO 和 关系 数据 库 本 身 不 兼容 ，OO 程 序 员 不 喜欢 使 用 SQL。SQL 基 于 集合 的 特性 并 不 容易 掌握 ， 并 且 不 受 那些 使 
用 OO 技术 的 Java 和 C++ 开发 人 员 的 欢迎 。 因 为 往往 对 访问 数据 的 方式 考虑 不 足 ， 会 导致 设计 不 佳 和 性 能 故障 。 


对 于 那些 受过 关系 原理 教育 的 人 来 说 ， 面 向 对 象 的 确 是 一 个 政治 讶 梦 。 企 业 常常 出 现 OO 编 程 支持 者 和 数据 资源 管理 组 之 间 
的 政治 斗争 。 支 持 OO 的 一 方 坚信 程序 和 组 件 最 重要 ， 支 持 数 据 的 一 方 坚 持 规范 化 ， 与 RDBMS 共 享 数 据 才 是 重 中 之 重 。 


由 于 围绕 面向 对 象 的 各 种 炒作 ， 支 持 OO 的 一 方 可 能 会 暂 居 上 风 ， 但 以 数据 为 中 心 的 思维 最 终 将 赢得 这 场 战争 。 从 长 远 来 
看 ,使 用 数据 规范 化 和 共享 数据 库 来 减少 匈 余 ， 可 以 提供 太 多 的 好 处 。 数 据 存在 独立 的 进程 ，OO 封 装 数 据 的 方法 可 以 掩盖 来 自 
其 他 进程 的 数据 ， 并 且 跨 企业 共享 数据 的 效率 很 低 。 如 果 不 关 注 数据 管理 和 良好 的 关系 规范 ， 将 导致 数据 质量 的 恶化 和 生产 率 的 
下 降 。 


如 果 在 关系 数据 库 中 使 用 OO 编程 语言 ， 那 么 需要 将 它们 结合 起 来 。 这 意味 着 应 用 程序 将 不 是 真正 意义 上 的 面向 对 象 ， 因 为 
数据 不 使 用 这 种 方法 ( 即 程序 ) 进行 封装 。 


你 需要 将 关系 与 OO 结合 起 来 。 


有 几 种 技术 可 以 使 面向 对 象 的 编程 语言 与 关系 数据 库 一 起 工作 。 系 列 化 、 使 用 代表 对 象 的 平面 文件 保存 数据 就 是 其 中 的 一 种 
方法 。 系 列 化 跨 应 用 程序 使 用 的 速度 很 慢 而 且 有 些 难度 ， 因 此 它 不 常用 于 持久 化 对 象 数据 。 第 二 种 方法 是 XML， 它 可 以 原生 地 
存储 在 许多 关系 数据 库 系 统 中 。 但 是 ，XML 会 增加 一 层 复 杂 性 ， 并 且 需 要 额外 的 编程 技巧 。XML 在 本 章 后 面 有 更 详细 的 讨论 。 


最 常见 的 方法 是 部 署 对 象 -关系 映射 (ORM) 的 解决 方案 。 通 过 ORM ， 对 象 属性 可 以 存储 在 关系 表 的 一 列 或 多 列 。 
Hibernate 是 Java 的 一 个 流行 的 ORM 库 。NHibernate 是 Hibernate 为 适应 .NET 框 架 的 改良 版 。Hibernate 和 NHibemate 都 能 
用 高 级 对 象 处 理 功 能 代替 直接 持久 性 相关 的 数据 库 访问 ， 为 将 对 象 映 射 到 关系 数据 库 提 供 了 可 能 。 另 一 种 选择 是 Microsoft 
LINQ， 即 语言 集成 查询 。LINQ 为 对 象 关 系 映射 提供 了 一 组 .NET 框 架 和 语言 扩展 。 


这 里 要 提醒 一 句 : 很 多 人 认为 ， 对 象 -关系 数据 库 可 以 解决 所 有 这 些 问 题 。 但 是 ， 对 象 -关系 数据 库 不 是 真正 的 面向 对 象 。 它 
基本 上 意味 着 DBMS 支 持 大 型 多 媒体 数据 类 型 ， 使 用 户 能 够 定义 自己 的 数据 类 型 和 功能 ,但 不 是 面向 对 象 。 所 以 不 要 混淆 了 这 些 
术语 。 


5.1.7 ”SQL 类 型 


SQL (虽然 是 一 种 语言 ) 包括 多 种 类 型 ， 它 们 表现 出 不 同 的 行为 特征 ， 并 且 需 要 不 同 的 开发 和 管理 技术 。SQL 可 以 根据 执行 
类 型 、 程 序 要求 和 活力 细 分 为 不 同 的 类 型 。 
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- SQL 可 以 是 有 计划 的 或 无 计划 的 。 有 计划 的 SQL 请 求 通常 谱 入 应 用 程序 中 ， 但 也 可 能 存在 于 查询 或 报告 工具 中 。 无 论 如 
何 ， 在 生产 系统 中 运行 有 计划 的 SQL 请 求 之 前 ， 一 定 要 对 其 设计 的 准确 性 和 效率 进行 测试 。 将 其 与 无 计划 的 SQL 请 求 的 特征 进行 
对 比 。 无 计划 的 SQL (也 称 作 临时 SQL) 在 业务 过 程 中 由 终端 用 户 匆 忙 创建 。 创 建 临 时 查询 ， 大 多 是 为 了 检查 那些 对 业务 产生 影 
响 的 数据 的 模式 和 发 展 趋势 。 无 计划 临时 的 SQL 请 求 会 导致 效率 低下 ， 并 且 很 难 调 整 。 试 问 ， 你 如 何 调整 一 个 经 常 写 经 常 改 的 请 
求 ? 


:SQL 可 以 误 入 在 程序 中 或 单独 发 出 。 明 入 式 SQL 在 应 用 程序 中 ， 而 独立 的 SQL 独自 运行 ， 或 在 查询 、 报 表 或 OLAP 工 具 内 


(i 
-SN 


. SQL 可 以 是 静态 或 动态 的 。 动 态 SQL 语句 在 运行 时 进行 了 优化 。 根 据 DBMS ， 动 态 SQL 语 句 也 可 以 在 运行 时 发 生 改 变 。 另 
一 方面 ， 静 态 SQL 会 在 运行 之 前 进行 优化 ， 只 有 通过 重新 编程 的 方式 才能 改变 。 推 荐 静态 SQL， 因 为 其 可 以 将 SQL 注入 攻击 的 可 
能 性 降 到 最 低 (参阅 “SQL 注入 ”) o 


就 这 三 种 特质 而 言 ， 程 序 员 必 须 能 够 量化 正在 开发 的 每 个 SQL 语句 。 每 个 SQL 语句 具有 其 中 一 种 属性 。 例 如 ， 某 个 SQL 语句 
可 以 是 有 计划 的 、 谋 入 式 的 、 静 态 的 请 求 ， 或 者 是 一 个 无 计划 的 、 独 立 的 、 动 态 的 请 求 。 确 保 在 正确 的 状态 下 使 用 正确 的 SQL 类 
型 。 表 5-2 中 列 出 了 各 种 情况 下 ， 最 有 用 的 SQL 类 型 。 当 然 ， 此 表 中 的 信息 仅 供 参考 。 你 应 该 凭借 你 在 环境 和 用 户 请 求 方面 的 知 
识 ， 选 择 正确 的 SQL 解 决 方案 类 型 。 


表 5-2 SQL 使 用 注意 事项 


ih 程序 需求 动 态 性 
SQL 语 林 的 列 和 请 辣 可 以 在 执行 吉 问 发 动态 
SLAA KA p 


HIAR 
高 并 发 、 高 性 能 的 事务 动态 或 静态 


临时 开关 查询 动态 
重复 分 析 查 询 FÈ EA ERAR SZ 动态 或 静态 
快速 一 次 性 修复 程序 SIT 内 和 人 或 独立 动态 或 静态 


SQL 注入 
一 种 常见 的 黑客 使 用 SQL 访问 数据 攻击 Web 应 用 程序 的 方式 是 SQL 注入 攻击 。 正 确 设 计 的 应 用 程序 可 以 阻止 SQL 注入 攻击 。 


SQL 注入 攻击 在 Web 表 单 域 插入 SQL 语句 导致 Web 应 用 程序 设计 不 当 ， 从 而 将 数据 库 的 内 容 暴 露 给 攻击 者 。 有 关 SQL 注 入 的 


深入 讨论 和 如 何 打击 SQL 注入 ， 请 参阅 第 14 章 。 


5.1.8 SQL 性 能 编码 


开发 数据 库 应 用 程序 的 很 大 一 部 分 是 要 确保 SQL 请 求 能 够 在 性 能 方面 正确 编码 。 因 此 ， 对 SQL 语 法 、 数 据 库 结构 和 编程 语言 
的 深入 理解 势 在 必 行 。 先 来 看 一 下 SQL。 


作为 数据 库 开 发 人 员 ， 首 先是 要 学 会 使 用 SQL (而 不 是 程序 逻辑 ) 。 在 DBMS 级 别 过 滤 掉 不 需要 的 数据 ， 比 在 程序 中 过 滤 更 
好 。 这 样 可 以 避免 数据 在 DBMS 和 程序 之 间 的 实际 移动 ， 因 此 会 达到 更 好 的 效率 。 例 如 ， 添 加 更 多 的 WHERE 子 句 到 SQL 
SELECT 语句 ， 与 通过 编程 方式 选择 所 有 行 并 过 滤 数 据 相 比 ， 前 者 的 效率 更 好 。 


使 用 SQL。 


另 一 个 例子 ， 考 虑 多 表 连 接 语 句 的 代价 。 也 就 是 说 ， 调 整 一 个 大 表 (四 个 表 连 接 而 成 ) ， 比 使 用 应 用 程序 逻辑 过 滤 并 连接 四 
个 独立 的 SQL SELECT 语句 更 容易 。 当 然 ， 前 提 是 假设 物理 数据 库 最 佳 ， 并 且 其 设计 可 以 微调 (如 通过 添加 索引 ) 。 


DBMS 过 滤 数 据 的 工作 做 得 越 好 ， 效 率 就 会 越 高 ， 因 为 运行 时 ， 需 要 在 DBMS 和 应 用 程序 之 间 移 动 的 数据 就 越 少 。 当 然 ， 这 
里 的 讨论 过 于 简单 ， 有 关 优 化 和 调整 SQL 的 内 容 还 有 很 多 。 更 多 细节 请 参阅 第 12 章 。 


5.1.9 查询 XML 数据 


如 今 ， 并 不 是 所 有 存储 在 数据 库 中 的 数据 都 是 关系 的 。XML 致 力 于 复杂 数据 ， 并 且 经 常用 于 基于 Web 的 应 用 程序 ， 同 时 还 
是 一 种 数据 传输 方式 ， 因 此 ， 越 来 越 受 到 大 家 的 欢迎 。 所 有 领先 的 DBMS 产 品 都 提供 XML 数 据 的 存储 和 管理 。 [1 


XML 代 表 可 扩展 标记 语言 (Extensible Markup Language) 。 你 可 能 熟悉 HTML (用 于 创建 网 页 的 标记 语言 ) 。 与 HTML 
一 样 ，XML 基 于 SGML (标准 通用 标记 语言 ) 。SGML 是 一 种 定义 标记 语言 的 语言 ， 由 国际 标准 化 组 织 (ISO) 开发 和 标准 化 。 


XML 使 用 标签 来 描述 数据 本 身 。 


HTML 使 用 标签 来 描述 数据 如 何 出 现在 一 个 Web 页 面 ，XML 的 设计 是 为 了 传输 和 存储 数据 。 换 句 话说 ，XML 有 点 自我 描 
述 。 它 使 用 标签 来 描述 数据 本 身 。XML 的 语法 很 简单 ， 使 其 更 易于 自动 化 处 理 ， 而 同时 又 非常 容易 理解 。 下 面 用 HTML 作 一 个 比 
喻 来 帮助 理解 XML。HTML 使 用 标记 来 描述 页 面 上 数据 的 外 观 。 例 如 ， 标 签 “text” 指 定 文本 数据 应 该 以 粗 体 显示 。XML 使 用 标 
签 来 描述 数据 本 身 ， 而 不 是 它 的 外 观 。 例 如 ， 考 虑 下 面 的 XML 摘 述 客户 地 址 : 
<CUSTOMER> 
<first_name>Craig</first_name> 
<middle_initial>S.</middle_initial> 
<last_name>Mul lins</last_name> 
<company_name>Mullins Consulting, Inc.</company_name> 
<street_address>15 Coventry Ct.</street_address> 
<city>Sugar Land</city> 
<state>TX</state> 
<zip_code>77479</zip_code> 


<country>USA</country> 
</CUSTOMER> 


XML 实际 上 是 一 个 元 语言 ， 也 就 是 说 ， 一 个 用 于 定义 其 他 标记 语言 的 语言 。 这 些 语 言 收集 到 字典 中 称 为 文档 类 型 定义 
(DTD) 。DTD 为 特定 行业 或 领域 存储 标签 的 定义 。 为 了 实现 同样 的 目的 ， 可 以 采用 XML 模式 ， 而 不 是 DTD。 


当 数 据 人 存储 为 XML 时 ， 使 用 标准 的 SQL 就 无 法 访问 它 。 相 反 ， 它 需要 XQuery 或 SQLMXMIL 扩 展 。 


XQuery 


XQuery 是 查询 XML 数据 集合 的 查询 和 程序 语言 。XQuery 使 用 XPath 表达 式 语 法 来 解决 XML 文档 中 的 特定 部 分 。 它 通过 一 
个 类 似 SQL 的 “FLWOR 表 达 式 ”来 执行 连接 。FLWOR 表 达 式 由 以 下 5 个 字句 构造 而 成 : 


- FOR; 
- LET; 


- WHERE; 


- ORDER BY; 
- RETURN. 


XQuery 语 言 不 只 是 查询 ， 还 可 以 构建 新 的 XML 文件 。 然 而 ，XQuery 缺 乏 更 新 XML 文件 或 数据 库 的 功能 ， 以 及 全 文 检索 的 
功能 。 但 是 ， 随 着 时 间 的 推移 ， 和 希望 这 些 问题 都 能 得 到 解决 。 


简 而 言 之 ，XQuery 是 一 种 编程 语言 ， 可 用 来 表示 任意 XML 到 XML 的 数据 转换 ， 具 有 较 强 的 类 型 和 逻辑 /物理 数据 独立 性 。 
SQL/XML 


SQL/XML 是 SQL 标准 的 一 个 扩展 ， 指 定 了 基于 SQL 的 扩展 ， 用 于 使 用 XML 与 SQL。 在 一 个 更 高 水 平 ， 它 提供 了 XML 数据 的 
类 型 ， 以 及 新 的 例 程 、 功 能 和 XML-to-SQL 数 据 类 型 映射 ， 支 持 在 SQL 数据 库 中 访问 和 操作 XML。 开 发 SQL/XML 是 为 了 与 
XQuery 互 补 。 


SQLXML 规 范 的 重点 是 ， 人 允许 用 户 访问 、 修 改 和 构建 XML 元 素 或 属性 功能 。 这 些 功 能 的 例子 包括 XMLDOCUMENT (返回 
一 个 XML 值 ， 具 有 单个 文档 节点 并 且 有 和 零 个 或 多 个 节点 作为 其 子 节点 ) 、XMLCONCAT (返回 一 串 XML 元 素 ， 由 两 个 或 多 个 元 
素 串 联 而 成 ) 、XMLELEMENT (返回 一 个 具有 元 素 名 称 的 XML 元 素 ， 一 个 可 选 的 属性 集合 和 零 个 或 多 个 组 成 元 素 内 容 的 参 
数 ) 、XMLAGG (返回 一 个 XML 序列 ， 其 中 包含 一 项 适用 于 一 组 XML 值 的 每 个 非 空 值 ) F. 


SQL/XML 还 定义 了 人 允许 用 户 将 XQuery 表 达 式 嵌入 SQL 语 句 ， 以 及 转换 复杂 的 数据 类 型 等 功能 。 这 些 功能 包括 XMLQUERY 
和 XMLTABLE。 


[1] 有关 XML 的 更 多 详细 信息 和 特殊 说 明 ， 请 参阅 下 列 网 站 : www.xmlorgfewww.w3.org/XML/. 


5.2 ”定义 事务 


事务 是 有 关 恢 复 和 一 致 性 的 原子 工作 单元 。 逻 辑 事务 通常 代表 在 线 用 户 执行 完整 的 业务 流程 。 它 可 能 由 几 个 步骤 组 成 ， 并 且 
可 能 包括 多 个 物理 事务 。 事 务 的 运行 结果 将 记录 业务 流程 的 影响 (完整 的 业务 流程 ) 。 事 务 运行 以 后 ， 数 据 库 中 的 数据 必须 正确 
HEX, 

事务 是 有 关 恢 复 和 一 致 性 的 原子 工作 单元 。 

当 组 成 具体 事务 的 所 有 步骤 都 完成 时 ， 发 出 COMMIT。COMMIT 表 示 所 有 步骤 (上 一 个 COMMIT 之 后 ) 都 正确 ， 可 以 外 


部 化 到 数据 库 。 执 行事 务 过 程 中 ， 任 何 时 候 都 可 以 作出 决定 : 停止 并 回 滚 上 一 个 COMMIT 之 后 的 所 有 变更 的 影响 。 如 果 一 个 事 
务 回 滚 ， 数 据 库 中 的 数据 将 恢复 到 原来 的 状态 。DBM S 通 过 维护 事务 日 志 (或 杂志 ) 跟踪 数据 库 的 变更 。 


事务 具有 ACID 属性 。ACID 是 原子 性 、 一 致 性 、 隔 离 性 和 持久 性 的 缩写 。 这 四 种 特质 是 正确 设计 事务 所 必需 的 。 


* 原子 性 意味 着 一 个 事务 必须 表现 出 “全 有 或 全 无 ”的 行为 。 要 么 事务 的 所 有 指令 都 发 生 ， 要 么 一 个 都 不 发 生 。 原 子 性 保持 
业务 流程 的 “完整 性 ”。 


“ 一 致 性 是 指 事务 执行 之 前 和 之 后 的 数据 的 状态 。 事 务 保持 数据 状态 的 一 致 性 。 换 和 句 话说， 执行 事务 后 ， 数 据 库 中 的 所 有 数 
据 都 是 正确 的 。 


` 隔离 性 意味 着 事务 可 以 同时 运行 。 并 行 运行 的 事务 容易 使 人 产生 错觉 : 它们 没有 并 发 。 换 句 话 说， 似乎 系统 每 次 只 能 运行 


一 个 事务 。 没 有 哪个 并 发 事务 可 以 预见 任何 其 他 事务 未 提交 的 数据 库 修 改 。 为 实现 隔离 ， 需 要 用 到 锁定 机 制 。 


* 持久 性 是 指 ， 当 一 个 事务 运行 时 ， 中 断 或 故障 的 影响 。 如 果 事 务 异 常 结束 ， 持 久 的 事务 并 不 会 影响 数据 的 状态 。 这 些 数据 
将 在 任何 故障 中 幸存 。 


下 面 用 一 个 例子 更 好 地 了 解 事务 对 数据 库 应 用 程序 的 重要 性 。 考 虑 一 个 银行 应 用 程序 。 假 设 你 想 从 Mega Bank 的 账户 中 取 
出 50 美 元 。 这 种 “业务 流程 ”需要 执行 一 个 事务 。 你 提出 取款 的 请 求 ， 无 论 是 当面 交 给 银行 柜员 ， 还 是 通过 使 用 ATM (自动 取 
款 机 ) ， 当 银行 收 到 你 的 请 求 时 ， 就 会 执行 以 下 任务 ， 这 组 成 了 一 个 完整 的 业务 流程 ， 银 行将 


1. 检 查 你 的 账户 ， 以 确保 有 资金 ， 可 以 取出 请 求 的 金额 。 

2. 此 时 ， 如 果 你 不 想 取款 ， 银 行 会 拒绝 此 次 请 求 并 停止 ， 否 则 继续 处 理 。 
3. 从 你 的 支票 账户 借 记 请 求 的 金额 。 

4 .为 进行 的 事务 产生 收据 。 

5. 将 请 求 的 金额 和 收据 交付 给 你 。 

设计 事务 ， 以 确保 ACID 属 性 。 


执行 取款 事务 必须 完成 所 有 以 上 步骤 ， 或 一 步 都 不 完成 ， 否 则 事务 中 的 一 方 都 不 会 满意 。 如 果 银 行 借 记 你 的 账户 ,但 不 给 你 
钱 ， 你 不 会 满意 。 如 果 银 行 给 你 钱 ， 但 不 借 记 账户 ， 银 行 不 会 满意 。 只 有 完成 所 有 这 些 步 骤 ， 才 能 构成 一 个 “完整 的 业务 流 
程 ”。 数 据 库 开发 人 员 必 须 了 解 必 要 的 业务 流程 并 设计 事务 ， 以 确保 事务 的 ACID 属性 。 


总 而 言 之 ， 一 个 事务 ， 如 果 单 独 在 一 致 的 数据 库 执 行 ， 要 么 完成 然后 产生 正确 的 结果 ， 要 么 终止 ， 不 产生 任何 影响 。 在 这 两 
种 情况 下 ， 数 据 库 的 结果 都 要 保持 一 致 的 状态 。 


5.2.1 事务 指南 


事务 持续 时 间 应 该 很 短 ， 因 为 它 需 要 锁定 共享 资源 。 当 然 ，“ 短 ”会 根据 系统 的 不 同 而 不 同 。 对 于 一 个 每 秒 处 理 成 干 上 万 个 
事务 的 大 系统 ， 短 事务 有 可 能 以 亚 秒 计 。 


事务 持续 时 间 应 该 很 短 。 


无 论 如 何 ， 事 务 都 必须 旨 在 从 方程 中 消除 人 为 因素 的 “思考 时 间 ”。 如 果 一 个 事务 锁定 某 些 资源 ， 其 他 事务 就 无 法 访问 这 些 
资源 。 因 此 ， 一 个 好 的 事务 设计 很 重要 ， 这 样 就 不 需要 在 处 理 期 间 等 待 用 户 输入 。 


5.2.2 ”工作 单元 


工作 单元 (UOW) 是 另外 一 种 描述 物理 事务 的 术语 。UOW 是 一 系列 的 指令 和 信息 ， 执 行 时 ， 用 于 保证 数据 的 完整 性 。 
此 ，UOW 和 事务 在 概念 方面 类 似 。 但 是 ，UOW 不 一 定 是 一 个 完整 的 业务 流程 ， 它 可 以 是 业务 流程 的 一 个 子 集 ， 一 组 工作 单元 
可 以 构成 一 个 事务 。 


UOW 是 一 系列 的 指令 和 信息 ， 用 于 保证 数据 的 完整 性 。 


每 个 UOW 必 须 具备 ACID 特性 。 换 名 话说， 如 果 事 务 失败 ， 发 生 故 障 时 的 数据 状态 必须 与 业务 需求 保持 一 致 。 


5.2.3 ”事务 处 理 系统 


事务 处 理 系统 (TP) 有 利于 事务 的 处 理 。 这 样 的 系统 有 时 也 称 作 事务 服务 器 或 事务 处 理 监视 器 。 无 论 名 称 如 何 ，TP 系 统 都 
提供 了 一 种 模式 ， 监 测 和 控制 事务 程序 的 执行 。TP 系 统 还 提供 了 一 个 API: 一 种 机 制 ， 用 于 程序 与 TP 服 务 器 进行 交互 和 沟通 。 
TP 系统 的 例子 包括 CICS、IMS/TM、Tuxedo 和 Microsoft 事 务 服务 器 。 


TP 系统 都 提供 了 一 种 模式 ， 监 测 和 控制 事务 计划 的 执行 。 


TP 系统 为 开发 和 执行 表示 逻辑 和 业务 逻辑 组 件 提供 了 环境 。TP 系 统 对 于 需要 大 量 并 发 用 户 和 最 小 停机 时 间 的 关键 任务 应 用 
程序 非常 有 用 。 如 果 使 用 得 当 ，TP 系 统 可 以 有 效 控制 许多 应 用 程序 (为 大 量 在 线 用 户 提供 服务 ) 的 并 发 执行 。TP 系 统 的 另 一 个 
好 处 是 它们 能 够 确保 跨 多 个 异 构 数 据 库 的 ACID 属 性 。 这 通过 使 用 两 阶段 COMMIT 完 成 ， 其 中 TP 系统 控制 数据 库 提交 的 发 出 ， 并 
确保 它们 可 以 顺利 完成 。 如 果 你 的 应 用 程序 需要 在 线 访 问 和 修改 异 构 数据 库 ， 建 议 使 用 TP 系统 。 


事务 服务 器 是 跨 异 构 环境 构建 高 性 能 和 可 靠 的 分 布 式 应 用 程序 的 理想 选择 。TP 系 统 可 支持 前 端 电子 商务 应 用 等 各 种 应 用 需 
求 ， 以 及 后 台 流 程 的 强大 需求 。 如 果 认 为 平台 的 独立 性 至 关 重 要 ，TP 系 统 可 以 帮助 开发 人 员 成 功 地 开发 、 管 理 和 部 署 在 线 应 用 
程序 ， 这 些 应 用 程序 完全 独立 于 基础 通信 、 硬 件 和 数据 库 环 境 。 


当然 ，TP 系 统 不 需要 为 每 个 应 用 程序 开发 数据 库 事务 。 DBM SS 本 身 可 为 它 所 管理 的 数据 提供 ACID 属性 。 然 而 ， 即 使 在 单一 
的 DBMS 环 境 ，TP 系 统 仍 可 以 为 开发 提供 方便 。 如 图 5-4 所 示 ， 它 显示 了 典型 的 应 用 程序 设置 : 没有 TP 系 统 的 数据 库 服务 器 。 客 


户 端 友 出 的 请 求 经 由 表示 层 到 达 数 据 库 服务 器 (DBMS) 。 客 户 端 可 以 直接 发 出 数据 库 服务 器 的 数据 请 求 ， 或 者 客户 端 可 以 通过 
执行 存储 程序 ， 在 数据 库 服务 器 上 运行 应 用 程序 逻辑 。 


现在 比较 图 5-4 和 图 5-5。 它 显示 了 一 个 使 用 TP 系 统 的 应 用 程序 。 数 据 库 请 求 在 TP 系 统 运行 ， 这 有 助 于 控制 事务 流程 。 此 
外 ，TP 系 统 使 应 用 程序 能 够 对 多 个 异 构 数据 库 提 出 请 求 ， 并 使 其 能 够 协调 数据 库 修 改 。 


存储 过 程 


关系 DBMS 


图 5-4 使 用 数据 库 服务 器 
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图 5-5 使 用 事务 服务 器 


如 果 数 据 库 应 用 程序 中 使 用 了 TP 系统 ，DBA 应 该 与 系统 管理 员 一 起 ， 确 保 建 六 DBMS 和 TP 系统 并 使 它们 能 够 有 效 地 协同 工 
作 。 此 外 ，DBA 和 SA 需要 持续 监测 DBMS 和 TP 系统 之 间 的 交互 。 


确保 DBMS 和 TP 系统 能 够 有 效 地 协同 工作 。 


5.2.4 ”应 用 程序 服务 器 


最 新 用 于 服务 数据 库 事务 的 中 间 件 是 应 用 程序 服务 器 。 应 用 程序 服务 器 通常 结合 了 事务 服务 器 的 功能 以 及 一 些 其 他 功能 ， 协 
助 构建 、 管 理 和 分 发 数据 库 应 用 程序 。 应 用 程序 服务 器 (例如 ，IBM 的 Websphere) 为 开发 各 种 组 件 并 将 其 集成 到 安全 、 面 向 
性 能 的 应 用 程序 提供 了 环境 。 


应 用 程序 服务 器 的 其 他 例子 包括 Zend Server (基于 PHP 的 应 用 程序 ) 、BASE4 Application Server (开源 ) 和 TNAPS 
Application Server (免费 ) 。 


使 用 应 用 程序 服务 器 有 几 个 优点 。 如 果 将 业务 逻辑 完全 集中 在 应 用 程序 服务 器 上 ， 应 用 程序 的 所 有 更 新 将 适用 于 所 有 的 用 
户 。 老 版 本 的 应 用 程序 可 能 会 淘汰 。 此 外 ， 应 用 程序 配置 的 变更 (如 移动 数据 库 服务 器 ) 可 以 集中 进行 ， 因 此 将 同时 适用 于 所 有 
用 户 。 此 外 ， 应 用 程序 服务 器 可 以 作为 应 用 程序 安全 性 的 中 心 点 。 


使 用 应 用 程序 服务 器 ， 应 用 程序 的 变更 可 以 集中 进行 ， 从 而 降低 风险 。 


应 用 程序 服务 器 也 可 以 为 事务 服务 器 服务 ， 如 事务 支持 交付 ， 因 此 一 个 工作 单元 是 原子 的 和 不 可 分 割 的 。 


5.3 锁 


开发 数据 库 程 序 的 每 一 个 程序 员 都 需要 了 解 出 现 并 发 问题 的 可 能 性 。 当 一 个 程序 试图 读 取 另 一 个 程序 正在 变更 的 数据 时 ， 为 
了 保证 数据 的 完整 性 ， 在 修改 完成 之 前 ，DBMS 必 须 禁 止 其 他 访问 。DBMS 使 用 了 锁 机 制 ， 使 多 个 并 发 用 户 能 够 访问 和 修改 数据 
库 中 的 数据 。 使 用 锁 ，DBMS 可 以 自动 保证 数据 的 完整 性 。DBM S 锁 定 策略 允许 来 自 多 个 环境 的 多 个 用 户 同时 访问 和 修改 数据 库 
中 的 数据 。 


锁 用 来 确保 数据 的 完整 性 。 当 数据 库 资源 被 一 个 进程 锁定 时 ， 另 一 个 进程 就 无 法 修改 锁定 的 数据 。 为 了 使 DBM3 能 够 为 事务 
处 理 的 ACID 属性 提供 便利 ， 锁 定 很 有 必要 。 


锁 用 来 确保 数据 的 完整 性 。 


数据 库 中 的 数据 可 能 有 不 同 的 锁定 级 别 。DBA 的 工作 是 根据 数据 的 访问 形式 以 及 并 发 用 户 访问 数据 的 程度 ， 为 每 个 数据 库 
对 象 确定 适当 的 锁定 级 别 。 从 理论 上 讲 ， 数 据 库 锁定 可 以 有 以 下 几 个 级 别 : 


“到; 
- 4f; 


“Rm (RR) ; 


A 


锁定 级 别称 为 镇 的 粒度 。 实 际 锁 的 粒度 级 别 将 取决 于 使 用 的 DBMS。 创 建 数据 库 对 象 时 ， 通 常情 况 下 ， 锁 的 粒度 由 DBA 控 
制 ， 但 是 如 果 没 有 指定 ， 可 能 会 使 用 一 个 默认 的 锁 粒 度 。 无 论 如 何 ， 创 建 数据 库 对 象 时 ，DBA 要 指定 锁 的 粒度 ， 这 是 一 个 很 好 
的 做 法 。 


锁 的 粒度 规范 ， 应 根据 将 访问 和 变更 数据 的 应 用 程序 和 用 户 的 需求 而 定 。 一 般 情 况 下 ， 锁 的 粒度 越 小 ， 人 允许 的 并 发 访问 越 
多 ， 如 图 5-6 所 示 。 然 而 ， 锁 的 粒度 越 小 ，DBM S 执 行 锁定 需要 消耗 的 资源 就 越 多 。 


锁定 的 最 小 单位 是 单个 列 ， 最 大 为 整个 数据 库 。 这 两 个 都 不 太 实际 。 锁 定单 个 列 可 以 使 同时 更 新 数据 的 能 力 最 大 化 ， 但 它 需 
要 太 多 的 系统 开销 。 相 反 ， 锁 定数 据 库 实 现 起 来 很 方便 ， 但 会 限制 并 发 ， 使 数据 库 只 为 单个 用 户 服务 。 

大 多 数 的 数据 库 实 现 选择 行 和 页 面 锁 定 。 对 于 许多 应 用 程序 ， 页 面 锁定 就 足够 了 。 但 是 ， 如 果 应 用 程序 需要 很 多 并 发 更 新 过 
程 ， 选 择 更 细 粒 度 的 行 锁定 可 能 更 适合 。 在 极 少数 情况 下 ， 运 行 某 个 特定 程序 时 没有 其 他 并 发 访问 ， 这 种 情况 可 以 使 用 表 锁定 。 
出 于 这 个 原因 ， 许 多 DBMS 产 品 都 提供 了 一 个 LOCK TABLE 命 令 ， 在 单个 或 UOW 进 程 中 ， 可 覆盖 当前 数据 库 对 象 的 锁 粒 度 。 
DBA 必 须 分 析 每 个 数据 库 对 象 的 应 用 程序 处 理 需求 ， 以 确定 最 佳 的 锁 粒 度 。 


大 多 数 的 数据 库 实 现 选择 行 和 页 面 锁 定 。 


访问 并 发 性 


低 


锁 的 粒度 


图 5-6” 锁 的 粒度 和 并 发 访问 


索引 条 目 也 可 以 锁定 ， 这 取决 于 DBMS 及 其 版 本 。 然 而 ， 索 引 锁定 会 对 性 能 造成 很 大 的 影响 。 因 为 索引 条 目 通常 都 比较 小 ， 
通过 锁定 来 阻止 应 用 程序 的 访问 并 不 常见 ， 特 别 是 当 DBMS 在 块 或 页 面 级 锁定 索引 时 。 某 些 DBMS 不 要 求索 引 锁 定 ， 而 是 通过 锁 
定数 据 来 确保 完整 性 。 请 记 住 ， 索 引 中 没有 的 数据 ， 表 中 也 没有 。 


索引 锁定 会 对 性 能 造成 很 大 的 影响 。 


锁定 的 确切 性 质 和 所 采取 的 锁 的 类 型 会 根据 DBM 的 不 同 而 不 同 。 本 节 将 涵盖 适用 于 大 多 数 DBM 产品 的 锁定 。 


5.3.1 ” 锁 的 类 型 


基本 上 ， 写 入 信息 时 ，DBM3 会 采取 “ 写 入 锁 ”; 读 取信 息 时 ，DBMS3 会 采取 “ 读 取 锁 ”。1INSERT、UPDATE 和 DELETE 语 
句 用 写 入 锁 ，SELECT 语 句 用 读 取 锁 。 但 要 真正 实现 这 样 的 锁 ， 典 型 的 DBM3s 将 使 用 三 种 基本 类 型 的 锁 : 共享 锁 、 独 占 锁 和 更 新 
锁 。 


当 读 取 数 据 不 需要 更 新 时 ，DBMS 采 取 共 享 锁 。 如 果 某 行 、 页 面 或 表 使 用 了 共享 锁 ， 其 他 进程 或 用 户 可 以 读 取 这 些 数据 。 
换 和 句 话说 ， 多 个 进程 或 用 户 可 以 对 相同 的 数据 使 用 共享 锁 。 


当 修 改 数据 时 ，DBMS 采 取 独 占 锁 。 如 果 某 行 、 页 面 或 表 使 用 了 独占 锁 ， 其 他 进程 或 用 户 一 般 都 不 允许 读 取 或 修改 这 些 数 
据 。 换 和 句 话说 ， 多 个 进程 或 用 户 不 能 对 相同 的 数据 使 用 独占 锁 。 


当 变 更 或 删除 数据 前 必须 先 读 取 数据 时 ，DBMS 采 取 更 新 锁 。 表 示 该 数据 可 能 会 在 未 来 修改 或 删除 。 如 果 数 据 真 正 修改 或 
删除 了 ，DBMS 会 将 更 新 锁 变 为 独占 锁 。 如 果 某 行 、 页 面 或 表 使 用 了 更 新 锁 ， 其 他 进程 或 用 户 一 般 可 以 读 取 数据 但 不 能 对 其 进行 
修改 。 因 此 ， 每 个 进程 或 用 户 都 可 以 有 一 个 更 新 锁 ， 同 时 其 他 进程 和 用 户 可 以 对 相同 的 数据 使 用 共享 锁 。 然 而 ， 多 个 进程 或 用 户 
不 能 同时 对 相同 的 数据 使 用 独占 锁 和 更 新 锁 ， 或 多 个 更 新 锁 。 


t 


向 锁 


dl 


t 


除了 共享 锁 、 独 占 锁 和 更 新 锁 ，DBMS 还 采取 另 一 种 类 型 的 锁 ， 称 为 意向 锁 。 当 某 个 用 户 或 进程 对 某 些 数据 页 面 或 行使 用 了 
锁 时 ， 意 向 锁 有 更 高 的 数据 库 对 象 优先 级 。 为 了 低级 锁 的 使 用 寿命 意向 锁 保持 不 变 。 


为 了 低级 锁 的 使 用 寿命 意向 锁 保 持 不 变 。 


例如 ， 考 虑 创建 一 个 表 ， 具 有 行 级 锁定 。 如 果 一 个 进程 锁定 该 行 ， 对 表 使 用 一 个 意向 锁 。 意 向 锁 主 要 用 于 确保 一 个 进程 不 能 
锁定 表 或 表 中 的 页 面 ， 因 为 这 将 与 另 一 个 进程 的 锁定 冲突 。 例 如 ， 如 果 某 用 户 持 有 某 行 的 独占 锁 ， 而 另 一 个 用 户 希 望 对 该 行 所 在 
的 表 使 用 独占 锁 ， 第 一 个 用 户 持 有 该 表 的 意向 锁 ， 就 可 以 确保 锁定 管理 不 会 忽视 他 的 行 级 锁 。 


5.3.2” 锁 超时 


如 果 数 据 被 一 个 进程 锁定 ， 其 他 进程 在 处 理 数据 之 前 必须 等 待 锁 释放 。 如 果 持 有 锁 的 时 间 很 长 ， 则 可 能 会 严重 降低 性 能 ， 
为 其 他 进程 必须 等 待 ， 直 到 锁定 释放 ， 数 据 才 会 变 得 可 用 。 此 外 ， 如 果 应 用 程序 设计 不 当 或 有 问题 ， 可 能 只 有 程序 失败 或 DBA 
干预 ， 锁 定 才 会 释放 。 

DBMSs 的 锁定 机 制 ， 防 止 进程 永远 等 待 一 个 超时 释放 的 锁 。 每 个 DBMS 都 提供 了 用 于 设置 锁定 起 时 值 的 参数 。 根 据 不 同 的 
DBMS， 锁 定 超时 值 可 能 会 设置 在 DBM 9 级别 、 进 程 级 别 或 连接 级 别 。 无 论 何 种 级 别 ， 一 个 进程 在 等 待 锁 预 先 设 定 的 时 间 ， 和 希望 
得 到 运行 授权 ， 此 时 进程 收 到 一 条 错误 消息 ， 告 知 设 定 的 超时 时 间 已 过 。 这 种 方法 假定 等 待 锁定 一 段 时 间 后 出 现 了 问题 。 超 时 防 
止 进程 无 限期 地 等 待 锁 ， 最 好 的 方法 是 放弃 和 释放 锁 而 不 是 继续 等 待 ， 这 样 会 妨碍 其 他 进程 的 运行 。 


收 到 锁定 超时 错误 时 ， 重 试 操 作 通 常 是 一 个 很 好 的 做 法 。 如 果 重 试 仍 发 生 锁定 超时 ， 程 序 应 该 记录 下 该 问题 ， 并 告知 用 户 不 


能 进行 。 


5.3.3 Fe 


另 一 个 可 能 出 现 的 锁定 问题 是 死 锁 。 当 并 发 进程 竞争 某 个 锁 时 ， 就 会 发 生死 锁 。 图 5-7 显 示 了 死 锁 的 情况 。 进 程 A 持 有 行 3 上 


的 锁 ， 请 求 行 ? 上 的 锁 ; 进程 B 持 有 行 7/ 上 的 锁 ， 请 求 行 3 的 锁 。 


进程 A pom 
KRX 
i 者 3 R 行 3 el 到 _ k l i | 
WA a p “| 数据 … 数 据 … 数 据 … 
a | 请 求 行 7 
请 求 行 7 | -4------- >| 数据 … 数 据 … 数 据 … 才 一 
fil Ps i 
| 请 求 行 3 
进程 A 在 等 待 进程 B jaws 


图 5-7 死 锁 


当 并 发 进程 竞争 菜 个 锁 时 ， 就 会 发 生死 锁 。 


死 锁 是 一 种 特定 类 型 的 锁定 超时 。 它 发 生 的 条 件 为 : 第 一 个 进程 持 有 锁 而 第 二 个 进程 请 求 ， 同 时 第 二 个 进程 持 有 锁 而 第 一 个 
进程 请 求 。 这 也 称 为 “致命 的 拥抱 ”。DBMS 将 选择 放弃 一 个 进程 并 回 滚 ， 这 样 其 他 进程 就 能 够 继续 了 。 


与 超时 相同 ， 程 序 在 收 到 死 锁 错误 信息 时 ， 最 好 重 试 操作 。 如 果 多 次 重 试 仍 发 生死 锁 ， 程 序 应 该 记录 下 问题 ， 并 告知 用 户 不 


能 进行 。 

如 果 死 锁 是 一 个 长 期 存在 的 问题 ， 可 能 需要 变更 应 用 程序 或 数据 库 设计 。 一 种 方法 是 考虑 改变 锁 的 粒度 (也 许 是 从 页 面 到 
行 ) ， 以 便 可 以 减少 每 个 锁定 请 求 锁定 的 数据 。 另 一 种 方法 是 变更 应 用 程序 。 你 可 能 重 写 程序 使 其 在 事务 开始 时 锁定 所 有 必要 的 
资源 。 然 而 ， 这 样 的 技术 对 于 大 多 数 应 用 程序 是 不 可 能 的 。 避 免 死 锁 的 最 后 一 种 方法 是 ， 确 保 你 公司 的 所 有 程序 以 相同 的 顺序 修 
改 数 据 库 。 如 果 设 定 了 每 个 程序 的 更 新 顺序 ， 就 可 以 最 大 限度 地 减少 或 消除 死 锁 。 也 许 ， 你 会 发 现 一 个 合理 的 逻辑 业务 顺序 ， 可 
以 用 于 应 用 程序 更 新 。 如 果 不 这 样 做 ， 还 可 以 考虑 使 用 某 种 规则 ， 如 按 字 母 顺 序 修改 。 


5.3.4 ”锁定 持续 时 间 


锁定 持续 时 间 指 DBMS 持 有 锁 的 时 间 长 度 。 数 据 库 资源 持 有 锁 的 时 间 越 长 ， 并 发 锁 请 求 等 待 的 时 间 就 越 长 。 随 着 锁 的 持续 时 
间 增 加 ， 锁 定 超时 的 可 能 性 也 相应 增加 。 


锁定 持续 时 间 指 DBMS 持 有 锁 的 时 间 长 度 。 


每 个 DBMS 都 提供 了 可 设置 的 参数 来 影响 锁 的 持续 时 间 。 通 常 ， 在 程序 、 事 务 或 SQL 语句 级 别 设置 这 些 参数 。 有 两 个 参数 可 
以 影响 锁 的 持续 时 间 : 隔离 等 级 和 获取 /发 布 规 学 说 明 。 


隔离 等 级 
隔离 等 级 为 事务 或 语句 指定 锁定 行为 。 标 准 SQL 定义 了 四 种 隔离 等 级 ， 可 以 使 用 SET TRANSACTION ISOLATION LEVEL 语 
句 设置 : 
。 UNCOMMITTED READ 
。 COMMITTED READ 


e REPEATABLE READ 
。 SERIALIZABLE 


上 述 所 列 的 进程 的 隔离 
外 ， 每 一 个 较 高 的 隔离 等 4 


等 级 是 从 最 低 到 最 高 。 隔 离 等 级 越 高 ， 锁 定 协议 就 越 严 格 。 隔 离 等 级 越 低 ， 锁 的 持续 时 间 就 越 短 。 另 
级 是 较 低 等 级 的 一 个 超 集 。 下 面 简单 了 解 一 下 隔离 等 级 。 


= 


BA SF AGE 1G RA RITA o 


UNCOMMITTED READ 隔 离 执行 通读 锁定 ， 有 时 也 称 作 脏 读 (dirty read) 。 它 仅 适 用 于 读 操 作 。 此 隔离 等 级 ， 可 以 读 取 
数据 库 中 根本 就 不 存在 的 数据 ， 因 为 事务 可 以 读 取 另 一 个 进程 已 变更 但 尚未 提交 的 数据 。UNCOMMITTED READ 隔 离 提供 最 高 
级 别 的 可 用 性 和 并 发 性 ， 但 数据 的 完整 性 最 糟糕 。 仪 适用 于 可 以 接受 某 些 数据 完整 性 问题 的 情况 。 某 些 类 型 的 应 用 程序 (如 那些 
使 用 分 析 查 询 、 估 算 和 平均 值 ) 往往 会 选择 UNCOMMITTED READ 锁 定 。 脏 读 可 能 会 导致 返回 重复 的 行 却 没有 行 存在 ， 或 没有 
返回 行 却 实际 存在 一 行 (或 多 行 ) 。 如 果 选 择 UNCOMMITTED READ 隔离， 程序 员 和 DBA 必 须 确 保 应 用 程序 可 以 接受 这 些 类 型 
的 问题 。 参 考 “ 脏 读 场景 ”， 了 解 如 何 用 UNCOMMITTED READ 隔 离 。 


COMMITTED READ 隔 离 (也 称 为 光标 稳定 性 ) 比 UNCOMMITTED READ 隔 离 提供 了 更 好 的 完整 性 。 当 指定 了 
COMMITTED READ 隔 离 时 ， 该 事务 将 不 会 读 取 尚未 提交 的 数据 ， 它 只 COMMITTED READ 数 据 。 


REPEATABLE READ 隔 离 为 读 取 设置 了 进一步 的 限制 ， 即 在 事务 过 程 中 ， 可 以 多 次 访问 相同 的 数据 但 不 改变 数据 的 值 。 如 果 
多 次 访问 ， 较 低 的 隔离 级 别 (UNCOMMITTED READ 和 COMMITTED READ) 允许 变更 基础 数据 。 在 事务 过 程 中 ， 当 可 以 多 次 
读 取 数 据 ， 并 且 数 据 的 值 必须 一 致 时 ， 才 使 用 REPEATABLE READ 隔 离 。 


脏 读 场景 


什么 时 候 合适 使 用 UNCOMMITTED READ 隔 离 ? 如 果 你 的 结果 必须 100% 的 准确 ， 建 议 避 免 使 用 它 。 例 如 ， 当 计算 必须 平衡 
时 ， 当 检索 数据 并 将 其 插入 另 一 个 表 中 时 ， 或 关键 任务 数据 的 一 致 性 和 完整 性 特别 重要 时 ， 都 应 避免 脏 读 。 


坦率 地 说 ， 大 多 数 数 据 库 应 用 程序 都 不 应 选择 脏 读 。 但 是 ， 也 有 特殊 情况 ， 允 许 读 取 未 提交 数据 。 


比如 ， 当 访问 引用 、 代 码 或 查找 静态 的 表 时 。 由 于 数据 不 易 变 ，UNCOMMITTED READ 通 常 无 异 于 使 用 一 个 更 严格 的 隔离 
级 别 。 对 于 那些 很 少 修改 查找 代码 的 情况 ， 这 些 问题 都 几乎 不 会 影响 并 发 事务 。 


如 果 一 个 事务 必须 执行 大 量 数据 的 统计 处 理 ， 其 可 以 使 用 脏 读 。 例 如 ， 考 虑 一 个 事务 返回 不 同 账户 的 平均 账户 余额 。 使 用 
UNCOMMITTED READ 隔 离 的 影响 是 最 小 的 ， 因 为 变更 一 个 值 不 会 对 结果 有 显著 影响 。 因 为 结果 是 多 个 值 的 平均 ， 一 个 或 者 几 
个 “ 坏 ” 的 值 不 可 能 显著 改变 平均 值 。 


脏 读 是 数据 仓库 查询 很 好 的 选择 。 数 据 仓库 对 时 间 敏 感 ， 面 向 主题 的 公司 ， 用 于 分 析 处 理 业 务 数据 。 除 了 定期 数据 传播 和 / 
或 复制 ， 数 据 仓库 访问 均 为 只 读 。UNCOMMITTED READ 只 会 造成 很 小 的 损害 ， 因 为 数据 一 般 不 会 改变 。 


一 些 极 少数 情况 也 可 以 考虑 使 用 脏 读 ， 如 一 个 事务 访问 某 个 表 或 一 组 表 ， 而 这 些 表 只 有 单个 用 户 才 可 以 使 用 。 如 果 只 有 一 个 
人 可 以 修改 数据 ， 可 以 编写 应 用 程序 ， 使 大 部 分 读 可 以 使 用 UNCOMMITTED READ 隔 离 ， 不 会 对 数据 的 完整 性 产生 不 利 影响 。 


最 后 ， 如 果 被 访问 的 数据 已 经 不 一 致 ， 使 用 脏 读 访 问 信 息 的 危害 也 不 大 。 


最 后 ，SERIALIZABLE 隔 离 提供 了 最 好 的 完整 性 。SERIALIZABLE 隔 离 删除 幻象 的 可 能 性 。 当 事务 打开 检索 数据 的 光标 时 ， 
随后 另 一 个 进程 插入 一 个 值 ， 该 值 正好 满足 请 求 ， 因 此 该 值 会 出 现在 检索 的 结果 集中 ， 这 时 就 会 产生 幻象 。 例 如 ， 考 虑 下 面 的 情 
况 : 


* 事务 1 打开 一 个 光标 ， 读 取 账 号 信息 ， 对 所 选 账户 的 总 余额 求 和 。 


“ 事务 2 插入 一 个 新 的 账户 ， 属 于 事务 1 正在 处 理 账 户 的 范围 ， 但 插入 时 事务 1 已 经 完成 了 新 账户 的 操作 。 


- 事务 2 COMMIT 揪 入 。 


“ 事务 1 运行 查询 对 所 有 的 值 求 和 ， 以 检查 求 和 的 准确 性 。 然 而 ， 总 数 将 不 匹配 。 
SERIALIZABILE 隔 离 提供 了 最 好 的 完整 性 。 

SERIALIZABLE 隔 离 消 除了 这 个 问题 。 幻 象 可 能 出 现在 较 低 的 隔离 级 别 ， 但 不 是 SERIALIZABLE 隔 离 级 别 。 
大 多 数 DBMSs 产 品 支 持 程序 或 事务 级 以 及 SQL 语句 级 的 隔离 级 别 规范 。 


请 记 住 ，DBMS 可 能 无 法 实现 所 有 这 些 隔离 级 别 ， 或 使 用 了 不 同 的 隔离 名 称 。 一 定 要 了 解 所 使 用 的 DBMS 支 持 的 隔离 ， 及 其 
对 应 用 程序 行为 和 锁定 时 间 的 影响 。 


获取 /发 布 规范 说 明 
影响 锁定 时 间 的 另外 一 个 参数 是 意向 锁 的 处 理 。 常 规 事务 锁 可 以 当 作 数据 访问 和 修改 。 然 而 ,一 些 DBMS 产 品 提供 方法 控制 


什么 时 候 采 取 意 向 锁 ， 意 向 锁 可 以 在 请 求 事务 时 立即 获得 ， 也 可 以 在 执行 事务 时 反复 获得 。 此 外 ， 事 务 完 成 后 或 工作 单元 不 再 需 
要 意向 锁 时 ， 可 以 释放 意向 锁 。 


如 果 DBMS 有 不 同 的 选项 可 用 于 获取 和 释放 意向 锁 ， 参 数 将 在 事务 或 程序 级 别 指定 。 


另外 一 个 锁定 选项 ( 某 些 DBMS) [是 跳 过 锁定 的 数据 。 如 果 你 编写 参数 指定 在 某 些 SQL 语句 上 SKIP LOCKED DATA, {E 
何 锁定 的 数据 将 会 跳 过 ， 而 不 是 DBMS 等 待 锁 释 放 。 


只 有 在 充分 了 解 其 影响 后 才 可 以 使 用 这 一 选项 。 当 你 告诉 DBM S 跳 过 锁定 的 数据 时 ， 不 访问 这 些 数 据 你 的 程序 将 无 法 使 用 。 
当然 ， 这 样 做 的 好 处 是 可 以 提高 性 能 ， 因 为 不 会 产生 任何 锁 等 待 时 间 ， 但 是 ， 代 价 是 它 不 能 访问 锁定 的 数据 。 


使 用 此 功能 应 该 非常 谨慎 。 跳 过 锁定 的 数据 之 前 ,一定 要 明白 你 在 做 什么 。 此 功能 很 容易 滥用 ， 结 果 读 取 的 数据 比 你 想 要 的 


S 


考虑 在 某 些 测试 环境 使 用 此 选项 ， 如 数据 是 只 读 的 数据 仓库 ， 适 当时 甚至 可 能 在 生产 阶段 。 例 如 ， 也 许 有 一 个 程序 需要 读 取 


某 个 表 (如 队列 ) 获得 下 一 个 数字 。 如 果 不 要 求 数字 必须 连续 ， 跳 过 锁定 的 数据 (通过 跳 过 任何 锁定 的 行 /页 ) 可 以 从 队列 中 获 
得 数据 。 


上 例如 ，DB2 for z/OS. 


5.3.5 WFR 


如 果 处 理 导致 DBMS 持 有 太 多 的 锁 ， 可 能 需要 锁 升 级 。 锁 升级 是 增加 进程 或 程序 的 锁 粒 度 的 过 程 。 当 升级 锁 时 ， 越 来 越 多 的 
数据 被 锁定 ， 但 实际 需要 的 锁 越 来 越 少 。 升 级 锁 的 例子 如 从 页 级 锁 到 表 级 锁 。 你 可 以 看 到 ， 这 将 最 大 限度 地 减少 DBMS 需 要 跟踪 
的 锁 的 数量 : 表 的 多 个 页 级 锁 可 以 转换 成 整个 表 的 单个 锁 。 当 然 ， 这 会 影响 并 发 访问 ， 因 为 进程 锁定 了 整个 表 ， 使 得 其 他 进程 无 
法 访问 。 


锁 升 级 是 增加 进程 或 程序 的 锁 粒 度 的 过 程 。 


DBM 根据 预 设 阔 值 揭 开 锁 升 级 的 序幕 。 通 常情 况 下 ，DBM 提供 的 系统 参数 可 以 设置 DBM s 升 级 锁 或 关闭 锁 升 级 的 实际 方 
式 。 此 外 ，DBMS 为 数据 库 对 象 提供 了 DDL 参 数 ， 表 明 在 对 象 - 对 象 的 基础 上 ， 是 否 应 该 升级 。 


有 些 DBMS (如 DB2 和 Microsoft SQL Server) 提供 了 锁 升级 的 能 力 ， 而 有 些 DBMS (如 Oracle) 则 不 提供 。 然 而 ，DB2 和 
Microsoft SQL Server 都 可 以 从 页 级 锁 升 级 到 表 级 锁 或 从 行 级 锁 升 级 到 表 级 锁 。 但 它们 都 不 允许 从 行 级 锁 升 级 到 表 级 锁 。 


5.3.6 “最 小 化 锁定 问题 的 编程 技术 


我 们 知道 ， 锁 定 是 为 了 确保 数据 的 完整 性 。 但 是 ， 如 果 应 用 程序 的 设计 没有 考虑 数据 库 锁 的 存在 ， 就 会 出 现 问题 。 应 用 程序 
开发 人 员 必 须 了 解锁 定 对 应 用 程序 的 性 能 和 可 用 性 的 影响 。 如 果 持 有 锁 的 时 间 过 长 ,会 导致 数据 减少 。 如 果 应 用 程序 以 一 个 混乱 
的 方式 请 求 锁 ， 可 能 会 发 生死 锁 ， 进 而 造成 可 用 性 问题 。 


但 幸运 的 是 ， 可 以 通过 一 些 开 发 技术 将 锁 的 问题 最 小 化 。 其 中 一 种 技术 是 ， 规 范 化 所 有 程序 内 的 更 新 序列 。 当 所 有 程序 的 更 
新 序列 是 一 样 的 时 ， 就 不 会 发 生死 锁 。 

规范 化 所 有 程序 内 的 更 新 序列 。 

另 一 种 编程 技术 是 在 事务 结束 前 ， 保 存 所 有 数据 的 修改 请 求 。 请 求 修 改 的 时 间 越 晚 ， 锁 的 持续 时 间 就 越 短 。 从 逻辑 的 角度 来 
看 ， 在 一 个 事务 中 何 时 进行 修改 都 无 关 紧 要 ， 只 要 所 有 修改 都 发 生 在 同一 事务 中 。 然 而 ， 将 数据 修改 逻辑 分 散在 整个 事务 中 ， 且 


分 散 模式 与 事务 处 理 的 概念 相 匹配 ， 会 让 大 多 数 开 发 人 员 感 到 更 加 舒服 。 分 组 修改 如 INSERT、UPDATE 和 DELETE 语 句 ， 事 务 快 
要 结束 时 执行 它们 ， 可 以 提高 并 发 性 ， 因 为 资源 被 锁定 的 时 间 较 短 。 


5.3.7 ”锁定 小 结 


数据 库 锁定 是 一 个 复杂 的 课题 ， 可 以 讨论 的 内 容 也 远 远 超过 本 节 所 提 到 的 。 每 个 DBM 执行 锁定 的 方式 各 不 相同 ， 你 需要 针 
对 使 用 的 DBM 的 实际 情况 ， 确 定 如 何 最 好 地 设置 锁定 粒度 和 隔离 级 别 ， 尽 量 减少 超时 和 死 锁 。 


5.4 HANE 


这 一 章 大 部 分 的 讨论 都 围绕 事务 处 理 (通常 称 作 在 线 过 程 ) 。 然 而 ， 许 多 数据 库 程 序 设 计 运 行 批 处 理 作业 时 ， 没 有 在 线 互 动 
要 求 。DBA 必 须知 道 批 处 理 数 据 库 方案 的 特殊 需要 。 


批 处 理 数 据 库 方 案 首先 天 注 的 是 ， 确 保 数 据 库 在 程序 内 提交 。 除 了 访问 少量 数据 的 非常 琐碎 的 程序 ， 应 定期 在 批 处 理 程序 中 
发 出 数据 库 提 交 以 释放 锁 。 不 这 样 做 ， 可 能 会 导致 一 些 问题 (如 因为 持 有 大 量 的 锁 导 致 并 发 程序 的 可 用 性 降低 ) ， 或 如 果 批 处 理 
程序 中 止 将 会 产生 大 的 干扰 ， 因 为 所 有 的 数据 库 修 改 必须 回 滚 。 


确保 是 数据 库 在 程序 内 提交 。 


此 外 ， 如 果 没 有 COMMIT 的 批 处理 程 序 失败 ， 在 解决 这 个 问题 以 后 重新 提交 批 处 理 程 序 ， 回 滚 的 所 有 工作 都 必须 重新 执 
行 。 COMMIT 的 批 处 理 程序 的 设计 必须 可 以 重启 : 批 处 理 程序 必须 跟踪 记录 最 后 一 次 成 功 COMMIT 的 进展 ， 包 括 所 有 光标 重新 
定位 到 程序 的 这 一 点 的 逻辑 。 当 程序 重新 启动 时 ， 必 须 检查 看 它 是 否 需要 重新 定位 ， 如 果 这 样 ， 在 处 理 前 需要 执行 重新 定位 逻 


辑 o 


批 处理 数 据 库 程序 开发 频繁 发 生 的 另 一 个 问题 是 : 开发 人 员 倾 向 于 考虑 文件 处 理 ， 而 不 是 数据 库 处 理 。 尤 其 是 那些 从 未 使 用 
过 数据 库 系统 的 大 型 机 COBOL 程 序 员 。 必 须 对 开发 人 员 进 行 一 些 数据 库 编程 技能 的 培训 ， 包 括 SQL 技 能 、 设 置 时 间 处 理 和 数据 
库 优 化 。 培 训 开 发 人 员 的 责任 往往 也 会 落 在 DBA 的 身上 。 


最 后 ， 批 处 理 程序 通常 在 预定 的 时 间 运 行 。DBA 应 该 协助 批 处 理 数据 库 作业 调度 ， 帮 助 减少 DBMS 的 负载 。 长 时 间 运 行 和 消 
耗资 源 的 批 处 理 作 业 应 安排 在 非 高 峰 期 的 在 线 事务 处 理 时 间 。 
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应 用 程序 的 设计 和 开发 是 系统 分 析 员 和 应 用 程序 程序 员 的 工作 。 然 而 ， 编 写 程序 访问 数据 库 时 ，DBA 必 须 参与 其 中 。 要 求 
的 特殊 技巧 可 能 很 难 掌握 。DBA 必 须 首先 了 解 这 些 技巧 ， 然 后 在 工作 中 将 它们 传授 给 开发 人 员 。 这 是 一 项 持续 的 工作 ， 因 为 原 
来 的 程序 员 随 时 会 离职 ， 然 后 招聘 新 的 程序 员 ， 每 个 人 的 数据 库 经 验 技巧 都 不 相同 。 此 外 ，DBMS 产 品 一 直 都 在 变化 ， 一 直 都 需 
要 掌握 额外 的 开发 选项 和 功能 。 


5.6 ”回顾 


1. 请 描述 缩写 ACID 是 指 什么 ， 并 定义 每 个 组 件 。 
2.ORM 是 什么 ? 为 什么 说 它 是 应 用 程序 开发 所 必需 的 ? 


3. 为 什么 要 求 锁定 来 保证 数据 的 完整 性 ? 


4. 请 描述 光标 稳定 性 和 可 重复 读 隔离 级 别 之 间 的 差异 。 

5. 在 什么 情况 下 应 考虑 未 提交 读 的 隔离 级 别 ? 

6. 请 说 出 两 种 应 用 程序 设计 技术 ， 其 可 以 将 锁定 对 应 用 程序 性 能 的 影响 降 到 最 低 。 

7. 关 系 闭 包 是 什么 意思 ?在 应 用 程序 设计 中 ， 它 有 什么 意义 ? 

8. 请 说 明 将 SQL 嵌 入 一 个 使 用 编程 语言 如 C 或 Visual Basic 编 写 的 应 用 程序 中 ， 需 要 什么 ? 
9. 锁 超时 和 死 锁 之 间 的 区 别 是 什么 ? 


10. 哪 些 编程 技术 可 以 用 来 减少 死 锁 ， 为 什么 ? 


附加 问题 


为 什么 在 一 个 事务 内 数据 库 的 修改 顺序 会 影响 死 锁 ? 
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Som tee 


在 数据 库 设计 过 程 和 应 用 程序 开发 生命 周期 (ADLC) 所 做 的 决策 ， 必 须 都 要 经 过 审查 以 确保 其 正确 性 。 这 就 是 设计 审查 的 
目的 。 


设计 审查 是 数据 库 应 用 程序 ADLC 的 重要 方面 。 数 据 库 和 应 用 程序 代码 的 所 有 方面 都 要 进行 审查 以 确保 其 有 效 性 、 正 确 性 和 
准确 性 。 无 论 规模 如 何 ， 所 有 的 数据 库 应 用 程序 都 有 必要 审查 以 确保 其 设计 得 当 、 编 码 技术 符合 成 本 效益 ， 并 且 该 数据 库 可 以 正 
确 、 高 效 地 访问 和 修改 。 设 计 审 查 是 一 个 重要 的 过 程 ， 审 查 设计 决策 是 否 有 效 以 及 在 应 用 程序 和 数据 库 提 升 到 生产 状态 之 前 纠正 
其 存在 的 错误 。 它 还 可 用 来 确保 开发 人 员 一 直 坚 持 公司 内 部 的 文档 标准 、 命 名 模式 、 可 维护 性 等 。 


数据 库 和 应 用 程序 代码 的 所 有 方面 都 要 进行 审查 以 确保 其 有 效 性 、 正 确 性 和 准确 性 。 


在 一 个 应 用 程序 的 生命 进程 中 ， 应 多 次 进行 设计 审查 。 在 使 用 数据 库 应 用 程序 时 ，DBA 必 须 参 与 各 阶段 的 每 一 次 设计 审 
查 。 此 外 ， 应 用 程序 部 署 的 前 、 中 、 后 都 有 必要 进行 审查 。 设 计 审 查 对 于 确保 应 用 程序 设计 得 当 且 符合 预期 是 至 关 重 要 的 。 


设计 审查 可 以 解决 开发 过 程 及 其 成 果 应 用 程序 的 许多 问题 。 通 过 对 应 用 程序 强制 进行 设计 审查 ， 在 彻底 的 审查 过 程 中 ， 该 应 
用 程序 的 每 一 个 基础 组 建 、 结 构 和 细微 差别 都 可 以 暴露 出 来 。 设 计 审 查 可 以 解决 的 问题 包括 : 


IED APY MOEA 

. 评估 远 辑 数据 模型 。 

. 评估 物理 数据 模型 。 

. 审查 并 分 析 物 理 DBMS 参 数 。 

- 预测 SQL 性 能 。 

. 评判 编程 语言 技术 部 署 的 实用 性 。 
. 生产 实施 后 ， 分 析 整 体 的 性 能 。 


每 次 设计 审查 应 由 主题 专家 、 开 发 人 员 及 其 同事 一 起 进行 。 通 常 DBA 必 须 作为 组 织 和 进行 每 次 设计 审查 的 重点 。 坦 率 地 
说 ， 如 果 DBA 不 组 织 设计 审查 ， 该 审查 就 可 能 进行 不 下 去 。 另 外 ， 如 果 不 进 行 设计 审查 ， 应 用 程序 将 会 在 生产 环境 更 容易 遇 到 
性 能 和 可 用 性 问题 。 


每 次 设计 审查 应 由 主题 专家 、 开 发 同行 及 其 同事 一 起 进行 。 


6.1.1 ”交战 规则 


在 定义 每 种 类 型 的 审查 之 前 ， 首 先 介 绍 设计 审查 的 基本 规则 。 设 计 审 查 由 一 组 人 员 共 同 进行 ， 他 们 具有 不 同 的 背景 、 技 能 、 
期 望 和 观点 。 这 样 的 一 组 人 召开 会 议 来 讨论 潜在 的 问题 和 错误 上 时， 交锋 在 所 难免 。 每 位 参与 者 必须 能 够 讨论 问题 并 就 问题 达成 某 
种 一 致 ， 不 将 审查 变 成 一 场 无 谓 的 战争 或 争吵 。 要 做 到 这 一 点 ， 参 与 者 必须 避免 好 斗 。 每 个 人 都 要 明白 他 们 共同 的 目标 是 促使 应 
用 程序 性 能 最 好 、 最 实用 。 


设计 审查 的 成 功 的 最 大 威胁 是 负面 的 批评 可 能 视 作 一 种 人 身 攻击 。 如 果 审 查 中 充满 了 威胁 或 开发 人 员 感 觉 如 此 ， 他 们 可 能 抗 
拒 继续 审查 或 接受 一 种 不 带 偏见 的 批评 。 为 了 避免 这 种 情况 ， 务 必 让 所 有 的 参与 者 都 用 事实 、 参 考 手 册 、 白 皮 书 、 文 章 、 博 客 引 
用 和 经 验 来 证 实 他 们 的 主张 和 建议 。 他 们 应 尽 可 能 地 提前 整理 好 自己 的 情绪 。 


所 有 的 参与 者 都 用 事实 、 参 考 手 册 、 和 白皮书 、 文 章 、 博 客 引 用 和 经 验 来 证 实 他 们 的 主张 和 建议 。 


6.1.2 ”设计 审查 的 参与 者 

对 于 设计 审查 的 参与 者 的 选择 ， 有 两 个 准则 确保 成 功 。 第 一 个 准则 是 为 设计 审查 设置 正式 的 角色 ， 并 为 这 些 角色 寻找 合适 的 
Att; 第 二 个 准则 是 确保 参与 者 拥有 合适 的 技能 来 积极 参与 设计 审查 过 程 。 

为 设计 审查 设置 正式 的 角色 。 


首先 ， 讨 论 一 个 成 功 的 设计 审查 都 需要 哪些 不 同 的 角色 。 正 式 的 角色 应 包括 一 名 领导 者 、 一 名 抄写 员 、 一 名 调解 员 和 若干 参 
与 者 。 


必要 的 是 ， 每 一 次 设计 审查 都 只 有 一 名 领导 者 。 对 于 不 同 的 设计 审查 ， 领 导 者 的 人 选 可 以 改变 ， 但 在 单 次 设计 审查 的 整个 过 
程 ， 领 导 者 不 可 改变 。 领 导 者 的 作用 是 多 方面 的 ， 包 括 : 


* 作为 司仪 保证 审查 过 程 能 够 顺利 进行 。 


ia 
o 


创建 并 遵循 一 个 议程 以 确保 本 次 设计 审查 的 各 方面 都 进行 得 令 人 满 
. 征集 各 参与 者 的 意见 。 
- 确保 各 参与 者 保持 适当 的 礼仪 。 
在 会 议 开 始 前 ， 与 参与 者 一 起 工作 确保 所 需 的 文档 都 可 用 。 
- 致力 于 其 他 工作 确保 设计 审查 能 够 成 功 。 


尽管 不 是 强制 的 ， 但 DBA 通 常会 充当 对 使 用 数据 库 的 应 用 程序 所 进行 的 设计 审查 的 领导 者 。 如 果 DBA 不 是 领导 者 ， 至 少 
DBA 团 队 必 须 有 权利 批准 领导 者 的 人 选 。 其 他 候选 人 包括 该 应 用 程序 的 所 有 者 或 主要 开发 人 员 。 有 时 ， 聘 请 参与 过 许多 不 同 的 
应 用 程序 的 设计 审查 的 顾问 来 充当 领导 者 也 是 个 不 错 的 选择 。 这 样 做 可 以 发 现 设计 流程 中 难以 发 现 的 问题 。 在 某 些 情况 下 ， 甚 至 
有 些 无 利害 关系 的 第 三 方 可 用 来 推动 审查 的 过 程 ， 只 要 这 个 人 有 设计 审查 会 议 的 经 


DBA 通 常会 充当 对 使 用 数据 库 的 应 用 程序 所 进行 的 设计 审查 的 领导 者 。 


抄 


写 员 的 职责 是 记录 设计 审查 过 程 中 所 有 的 讨论 要 点 。 尽 管 抄写 员 在 设计 审查 中 不 是 积极 的 参与 者 ， 但 也 是 必需 的 。 没 有 记 
录 审 查 会 导 肥 


会 议 重要 信息 的 遗失 。 
抄写 员 必 须 能 够 理解 技术 讨论 但 不 一 定 从 事 技术 工作 。 他 可 以 是 开发 团队 的 一 员 ， 拥 有 优秀 的 听写 技能 。 技 术 悟 性 较 高 的 行 
政 助理 可 能 是 另外 一 个 不 错 的 选择 。 


调解 员 


调解 员 的 角色 是 可 选 的 ， 但 也 可 能 是 个 福星 ， 这 取决 于 项 目 以 及 设计 审查 进行 的 情况 。 调 解 员 的 主要 职责 是 在 发 生 分 歧 时 帮 
助 协商 ， 并 且 考 虑 设计 审查 的 性 质 ， 分 歧 会 经 常 发 生 。 如 果 意 见 分 层 变 得 僵持 不 下 ， 调 解 员 将 听取 分 歧 各 方 的 意见 并 做 出 公正 的 
判决 。 


尽管 好 的 领导 者 应 该 有 能 力 解决 大 部 分 的 分 层 ， 但 干预 分 歧 带 来 的 不 满 可 能 会 对 其 权威 造成 影响 。 通 过 将 最 困难 和 最 敏感 的 
决策 权 推 给 调解 员 ， 领 导 者 可 以 保持 团队 人 员 的 信任 并 挽救 濒临 瓦解 的 设计 审查 。 技 术 管 理 代 表 通 常 是 调解 员 的 最 佳人 选 。 


调解 员 的 主要 职责 是 在 发 生 分 此 时 帮助 协商 。 


设计 审查 的 参与 者 是 与 项 目 有 利害 关系 的 人 员 。 参 与 者 会 因 项 目的 改变 而 改变 ， 并 且 随 设计 审查 的 不 同 而 不 同 。 以 下 是 推荐 
的 人 选 : 


设计 审查 的 参与 者 是 与 项 目 有 利害 关系 的 人 员 。 


:从事 该 项 目的 应 用 程序 开发 人 员 。 


.新 的 应 用 程序 会 影响 的 其 他 应 用 程序 的 代表 。 


| 数据 管理 代表 。 


| 数据 库 管 理 代表 。 


. 终端 用 户 代表 。 


. 终端 用 户主 管 。 


" 新 应 用 程序 以 及 可 能 受 其 影响 的 其 他 应 用 程序 的 IT 主管 。 


事务 处 理 和 消息 队列 系统 的 在 线 支持 代表 。 

© 支持 Web 功 能 的 应 用 程序 和 网 络 支持 人 员 。 

- 操作 支持 代表 。 

* [本 安全 代表 。 

TT 审计 代表 (对 于 管制 和 敏感 的 应 用 程序 以 及 数据 ) o 
- 技术 支持 和 系统 程序 设计 代表 。 


没有 必要 让 所 有 这 些 参与 者 参加 每 一 次 


设计 审查 的 每 个 方面 。 单 个 应 用 程序 应 进行 多 次 设计 审查 ， 每 一 次 审查 关注 该 应 用 程 
序 的 一 个 特殊 面 。 在 每 次 设计 审查 前 应 确定 该 审查 


的 范围 ， 以 便 只 邀请 适当 的 参与 者 。 


6.1.3 ”所 需 的 知识 与 技能 

要 想 成 为 设计 审查 团队 的 一 员 ， 候 选 者 应 具备 一 定 的 数据 库 开 发 经 验 ， 而 参与 者 最 好 具备 相当 的 技能 和 知识 。 设 计 审 查 团队 
的 组 建 应 由 以 下 标准 为 指导 

` 强大 的 技术 能 力 : 技术 人 员 、 程 序 员 和 DBA。 

. 强大 的 沟通 能 力 : 所 有 参与 者 。 

. 优秀 的 人 际 交往 能 力 : 所 有 参与 者 。 

- DBMS 基 础 : 所 有 参与 者 达到 各 自 职位 要 求 的 学 位 。 

+ 数据 建 模 和 数据 库 设计 的 背景 : DA 和 DBA 深 入 了 解 ， 程 序 员 和 其 他 技术 人 员 很 好 地 掌握 ， 其 他 参与 者 一 定 程度 地 了 解 。 


. 强大 的 SQL 知识 : 技术 人 员 、 程 序 员 和 DBA。 


当然 ， 并 不 是 每 个 成 员 都 要 具备 所 有 以 上 技能 。 [但 是 ， 确 保 设 计 审查 团队 的 成 员 都 是 各 自 领 域 的 实践 专家 。 例 如 ， 
理 的 SQL 知识 可 能 有 限 ， 但 这 不 能 成 为 阻止 他 进入 设计 审查 团队 的 理由 。 他 了 解 项 目 且 具 有 管理 技能 ， 因 此 应 该 中 选 ， 这 样 就 可 
以 利用 他 擅长 领域 的 经 验 。 


设计 审查 团队 的 成 员 都 是 各 自 领 域 的 实践 专家 。 


此 外 ， 在 整个 ADLC 中 应 尽力 保持 同一 组 团队 成 员 。 因 为 有 多 次 设计 审查 ， 所 以 团队 成 员 的 一 致 将 使 审查 更 容易 ， 因 为 从 以 
往 的 审查 获得 的 知识 将 有 助 于 后 续 的 设计 审查 。 


[1] 实际 上 ， 大 多 数 参 与 者 仅 具 有 几 种 此 处 所 描述 的 特质 。 这 意味 着 ,设计 审查 的 领导 者 在 参与 审查 时 要 做 好 心理 准备 ， 有 时 审 


查 过 程 可 能 会 达 不 到 理想 的 情况 。 


正如 前 面 提 到 的 ， 整 个 ADLC 过 程 中 最 好 要 进行 多 次 设计 审查 。 多 次 设计 审查 比 单独 的 一 次 大 型 设计 审查 更 好 ， 因 为 这 可 以 
尽早 发 现 开发 过 程 中 的 错误 和 设计 缺陷 ， 并 且 更 有 可 能 花 较 少 的 成 本 来 解决 这 些 问题 。 


以 下 是 数据 库 应 用 程序 的 七 个 基本 的 设计 审查 阶段 : 
. 概念 设计 审查 。 
. 逻辑 设计 审查 。 


- 物理 设计 审查 。 


. 组 织 设计 审查 。 

- SQL 和 应 用 程序 代码 审查 。 
.部署 前 的 设计 审查 。 

. 部 署 后 的 设计 审查 。 


还 记得 图 1-2 所 示 的 ADLC 效 果 图 吗 ? 图 6-1 指 出 了 ADLC 中 每 个 对 应 的 点 应 进行 哪 种 设计 审查 。 
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图 6-1 应 用 程序 开发 生命 周期 内 的 设计 审查 


6.2.1 概念 设计 审查 

首先 要 进行 的 是 概念 设计 审查 。 该 审查 的 目的 是 验证 数据 库 和 应 用 程序 的 概念 。 它 以 整体 目的 陈述 的 介绍 和 应 用 程序 所 提供 
功能 的 总 体 概述 开始 。 

概念 设计 审查 的 目的 是 验证 数据 库 和 应 用 程序 的 概念 。 


在 应 用 程序 的 开发 生命 周期 ， 应 尽早 进行 概念 设计 审查 以 确定 项 目的 整体 可 行 性 。 概 念 审查 的 结果 必须 可 以 用 来 验证 应 用 程 
序 的 目的 以 及 构建 数据 库 及 其 配套 应 用 程序 的 愿景 是 否 清晰 。 


为 了 进行 概念 设计 审查 ， 不 仅 要 有 概念 数据 模型 ， 还 要 有 应 用 程序 的 高 层次 设计 。 
未 能 进行 概念 设计 审查 可 能 会 导致 
:项目 提供 的 功能 重复 或 不 适当 


. 由 于 缺乏 资金 、 人 员 配 备 不 适当 、 计 划 不 周 、 缺 乏 用 户 参 与 或 管理 权益 减少 ， 项 目 取消 。 


. 项 目 超 出 预算 或 需要 比 预期 更 长 的 时 间 来 完成 。 
- 应 用 程序 不 能 提供 业务 所 需 的 特征 和 功能 。 


参与 概念 设计 审查 的 人 选 应 包括 : 应 用 程序 开发 、 数 据 管理 和 数据 库 管理 人 员 ， 终 端 用 户 ， 来 自 终端 用 户 和 IT 的 管理 代表 。 


6.2.2 ”逻辑 设计 审查 

逻辑 设计 审查 跟随 概念 设计 审查 。 当 逻辑 数据 模型 的 第 一 次 切入 完成 时 ， 就 要 进行 逻辑 设计 审查 了 。 它 包括 对 所 有 的 数据 元 
素 、 描 述 和 关联 进行 彻底 的 审查 。 应 解决 的 问题 有 : 

" 是 否 已 经 对 逻辑 数据 模型 进行 了 彻底 的 检查 以 确保 所 有 所 需 的 业务 功能 都 可 以 实现 ? 

“ 该 模型 满足 (至 少 ) 第 三 范式 吗 ? 

` 应 用 程序 所 需 的 所 有 数据 元 素 ( 实 体 和 属性 ) 是 否 都 已 标识 ? 

已 经 标识 的 数据 元 素 是 否 准 确 地 记录 ? 

“ 是 否 为 各 属性 分 配 了 适当 的 数据 类 型 和 准确 的 长 度 ? 

“ 所 有 的 关联 是 否 正确 定义 ? 

逻辑 设计 审查 检查 所 有 的 数据 元 素 、 描 述 和 关联 。 


未 能 进行 逻辑 设计 审查 可 能 会 使 数据 库 的 设计 拙 盆 ， 进 而 引起 数据 完整 性 问题 。 逻 辑 设 计 审查 有 助 于 确保 所 有 必需 的 数据 已 
经 识别 、 设 计 正 确 并 完全 记录 。 如 果 在 一 次 逻辑 设计 审查 之 后 ， 逻 辑 数据 模型 有 所 改变 ， 那 么 应 再 次 进行 逻辑 设计 审查 。 

逻辑 设计 审查 的 参与 者 应 与 参加 概念 设计 审查 的 人 员 相同 。 如 果 可 能 ， 应 由 同一 拨 人 参加 ， 这 样 可 以 使 每 次 审查 的 水 平 都 保 
持 一 致 。 参 与 者 相同 ， 将 需要 较 少 的 前 期 准备 ， 因 为 大 家 都 已 经 了 解 该 应 用 程序 的 目的 及 其 高 层次 的 概念 设计 。 


6.2.3 ”物理 设计 审查 


接 下 来 是 物理 设计 审查 ， 也 是 整个 设计 审查 过 程 中 最 常见 的 审查 。 进 行 物理 设计 审查 时 ， 需 要 仔细 审查 数据 库 ， 以 确保 所 有 
的 数据 库 参 数 设置 和 其 他 物理 设计 选项 都 正确 。 此 外 ，DA 和 DBA 也 要 确保 从 逻辑 模型 到 物理 数据 库 的 转换 正确 ， 并 且 所 有 非 标 
准 化 的 定义 也 都 正式 地 记录 。 


物理 设计 审查 确保 所 有 的 数据 库 参 数 设 置 和 其 他 物理 设计 选项 都 正确 。 


这 一 阶段 应 描述 并 验证 应 用 程序 的 整体 操作 环境 。 还 应 提供 并 验证 事务 处 理 器 的 选择 以 及 网 络 环境 的 完整 描述 。 估 计 并 审查 
工作 负载 、 吞 吐 量 和 并 发 用 户 的 数目 ， 以 确保 预期 的 需求 令 人 满意 。 批 量 的 工作 负载 也 要 审查 ， 因 此 ， 还 必须 提供 任何 批 处 理 的 


完整 描述 。 


物理 设计 审查 可 能 要 在 应 用 程序 的 所 有 SQL 都 可 用 之 前 进行 。 然 而 ， 需 要 凭借 全 程 的 一 般 描述 来 验证 提出 的 物理 数据 库 设 
计 。 通 过 该 描述 ， 可 以 对 数据 库 的 定义 进行 微调 。 而 且 ， 还 应 对 非 规范 化 是 否 有 用 进行 初步 估计 。 


随 着 应 用 程序 开发 过 程 的 进展 ， 物 理 数 据 库 设 计 部 分 可 能 需要 进行 再 次 审查 。 确 保 物理 设计 有 效 需 要 大 量 深 入 的 关注 。 
此 ， 可 以 将 审查 分 解 成 离散 的 过 程 ， 当 数据 库 和 应 用 程序 有 改动 时 ， 就 重复 这 些 过 程 。 例 如 ， 当 SQL 语句 写 入 时 ， 索 引 需 求 会 改 
变 。 索 引 加 入 时 ， 应 对 决策 过 程 进行 审查 ， 以 确保 该 索引 对 整个 应 用 程序 而 不 只 是 某 个 SQL 语句 是 可 行 的 。 


物理 设计 审查 的 参与 者 应 包括 : 应 用 程序 开发 人 员 、 数 据 管理 人 员 、 数 据 库 管 理 人 员 、 在 线 支持 代表 和 技术 支持 人 员 。 如 果 
应 用 程序 或 数据 库 会 影响 其 他 应 用 程序 ， 或 由 其 他 应 用 程序 使 用 ， 那 么 也 要 包括 这 些 区 域 的 代表 。 


6.24 组 织 设 计 审 查 

组 织 设计 审查 的 审查 范围 小 于 物理 设计 审查 ,但 两 者 却 同 等 重要 。 该 审查 在 全 企业 范围 检查 广泛 关注 的 新 应 用 程序 的 问题 。 
以 下 是 一 些 常 见 的 组 织 设计 审查 问题 : 

组 织 设计 审查 评估 应 用 程序 对 企业 的 影响 。 

. 该 系统 是 如 何 与 企业 中 的 其 他 系统 进行 交互 的 ? 

. 该 应 用 程序 的 逻辑 数据 模型 是 否 已 经 集成 到 企业 数据 模型 (如 果 存 在 ) ? 

到 什么 程度 该 应 用 程序 才 可 以 共享 其 他 应 用 程序 的 数据 ? 

* 到 什么 程度 其 他 应 用 程序 才 可 以 共享 该 应 用 程序 的 数据 ? 

“ 如 何 将 该 应 用 程序 所 需 的 DBMS 资 源 集成 到 当前 的 生产 环境 中 ? 

" 部 署 该 应 用 程序 是 否 会 导致 批 处 理 窗口 溢出 ? 

: 该 应 用 程序 的 一 些 需 求 ， 如 在 线 响 应 时 间 和 /或 数据 可 用 性 ， 是 否 会 对 其 他 用 户 产生 负面 影响 ? 

.部署 该 应 用 程序 是 否 会 导致 商家 数据 处 理 需 求 的 扩大 ? 例如 ， 需 要 更 多 内 存 、CPU 能 力 或 存储 。 

. 该 企业 能 否 基 于 行业 和 政府 法 规 为 应 用 程序 圆满 实施 适当 水 平 的 审计 和 安全 ? 


由 于 组 织 设计 审查 的 目的 是 评估 该 应 用 程序 对 企业 的 影响 ， 在 6.1.2 节 中 罗列 的 所 有 人 都 应 参与 该 审查 。 任 何人 缺席 都 可 能 
因为 无 知 或 琉 忽 而 遗漏 某 些 应 用 程序 对 企业 的 影响 。 


6.2.5 ”SQL 与 应 用 程序 代码 设计 审查 

SQL 设计 审查 是 对 应 用 程序 中 的 每 一 条 SQL 语句 进行 的 严格 审查 。 每 条 SQL 语句 在 应 用 到 生产 之 前 都 必须 进行 审查 。 该 审查 
要 分 析 每 个 语句 的 访问 路 径 、 使 用 的 索引 和 可 能 的 替代 公式 ， 即 全 面 评价 它 是 如 何 执行 的 。 

SQL 设计 审查 是 对 应 用 程序 中 的 每 一 条 SQL 语句 进行 的 严格 审查 。 


每 个 DBMs 都 提供 了 一 个 命令 来 显示 用 于 SQL 语句 的 访问 路 径 。 通 常 ， 该 命令 叫做 EXPLAIN 或 SHOWPLAN ， 本 书 将 
EXPLAIN 作 为 通用 的 术语 。 在 进行 SQL 设计 审查 前 ， 每 条 SQL 语句 都 应 运行 EXPLAIN 命 令 。 重 要 的 是 ，EXPLAIN 命 令 可 以 访问 
生产 统计 。 应 该 对 EXPLAIN 命 令 的 运行 结果 进行 分 析 ， 从 而 确定 是 否 选择 了 最 有 效 的 访问 路 径 。 


此 外 ， 每 个 程序 都 应 该 进行 审查 以 验证 所 使 用 的 编程 语言 结构 是 否 高 效 。 尽 管 SQL 很 可 能 会 引起 关系 性 能 低下 ， 也 可 能 
COBOL, Visual Basic、5 或 其 他 任何 语言 编写 的 程序 效率 不 高 。 例 如 ， 一 条 经 过 有 效 调整 的 SQL 语句 嵌入 了 一 个 用 5 编写 的 循 
环 ， 如 果 这 个 循环 运行 数 百 或 数 干 次 ， 这 条 SQL 语句 就 可 能 变 得 效率 非常 低 。 其 他 有 关 应 用 程序 和 SQL 的 性 能 问题 在 第 12 章 中 有 
详细 的 讨论 。 


再 次 强调 : 每 行 代码 和 每 条 SQL 语句 在 部 署 前 都 必须 进行 审查 。SQL 与 应 用 程序 设计 审查 时 正好 可 以 在 应 用 程序 转移 到 生产 
状态 之 前 提出 性 能 改进 的 建议 。 本 次 审查 可 以 建议 蔡 代 公式 和 索引 策略 ， 然 后 对 它们 进行 测试 以 确定 将 产生 什么 影响 。 如 果 性 能 
提升 了 ， 应 用 程序 代码 、SQL 或 数据 库 设计 都 要 进行 相应 的 修改 。 


应 用 程序 开发 人 员 和 DBA 必 须 参 与 应 用 程序 域 SQL 的 设计 审查 。 其 他 参与 者 可 能 包括 应 用 程序 开发 经 理 以 及 技术 上 悟性 很 高 
的 终端 用 户 。 在 某 些 情况 下 ， 审 查 代码 时 邀请 相应 开发 人 员 的 经 理 ， 可 能 会 让 开发 人 员 感 沉 更 舒服 。 此 举 可 以 使 整 件 事 情 看 起 来 
不 像 是 DBA 在 一 直 对 程序 员 数 月 的 辛苦 工作 指 手 画 脚 。 当 然 ， 这 样 的 决定 也 要 根据 具体 情况 进行 具体 分 析 ， 取 决 于 开发 人 员 有 
上 级 在 场 时 是 否 拘束 ，DBA 的 个 人 互动 技巧 ， 以 及 DBA 和 程序 员 的 技术 水 平 。 


6.2.6 ”部 署 前 的 设计 审查 


应 用 程序 转移 到 生产 状态 前 应 立即 进行 部 署 前 的 设计 审查 。 该 审查 包括 对 部 署 前 的 系统 组 件 的 整体 评估 。 每 个 参与 者 都 必须 
做 好 准备 ， 一 旦 应 用 程序 转移 到 生产 环境 ， 为 支持 该 应 用 程序 所 做 出 的 任何 更 改 状态 都 需要 进行 讨论 。 然 后 ， 还 应 对 先前 设计 
查 遗 留 下 来 的 零碎 资料 进行 审查 ， 验 证 是 否 已 经 对 其 进行 了 必要 的 修改 和 测试 。 最 后 ， 对 每 个 应 用 组 件 进行 一 次 快速 、 最 终 的 
查 ， 确 保修 改 并 没有 带 来 新 的 问题 。 


审 
审 


部 署 前 的 设计 审查 是 对 系统 组 件 的 整体 评估 。 


部 署 前 的 设计 审查 的 参与 者 应 包括 : 应 用 程序 开发 团队 的 人 员 、 应 用 程序 开发 管理 代表 、 数 据 库 管 理 人 员 、 在 线 支 持 代表 和 
技术 支持 人 员 。 另 外 ， 还 可 以 邀请 一 些 技术 上 悟性 很 高 的 终端 用 户 。 


6.2.7 ”部 署 后 的 设计 审查 


最 后 一 项 是 部 署 后 的 设计 审查 。 当 应 用 程序 在 生产 环境 运行 一 段 时 间 后 ， 有 必要 对 其 进行 一 次 正式 的 审查 来 确定 它 在 性 能 上 
以 及 功能 上 是 否 都 符合 预期 的 目标 。 如 果 与 目标 不 符 ， 必 须要 给 出 解决 缺陷 的 计划 并 付出 行动 。 尽 管 需要 对 新 的 应 用 程序 进行 日 
性 能 监控 ， 但 也 不 排除 还 需要 对 所 有 新 的 应 用 程序 项 目 进行 一 次 正式 的 部 署 后 的 设计 审查 的 可 能 。 


部 署 后 的 设计 审查 确定 应 用 是 否 符合 预期 的 目标 。 


部 署 后 的 设计 审查 可 以 确定 应 用 程序 是 否 符合 预期 的 目标 。 由 于 程序 的 任何 部 分 都 有 可 能 进行 改动 ，6.1.2 节 中 列 出 的 所 有 
人 都 应 参加 该 审查 。 


6.3 ”设计 审查 输出 


审查 输出 应 简洁 明了 ， 以 便 所 有 需要 修改 的 应 用 程序 、SQL 或 数据 库 都 能 快速 、 正 确 地 进行 。 且 抄写 员 记录 下 了 足够 多 的 细 
节 ， 即 使 未 出 席 者 也 可 以 了 解 讨 论 的 内 容 。 抄 写 员 应 对 会 议 记 录 的 语法 和 拼写 进行 编辑 ， 然 后 发 给 所 有 的 与 会 者 (最 好 是 通过 e- 


mail) 。 
设计 审查 输出 应 简洁 明了 ， 以 便 所 有 需要 的 修改 都 能 快速 、 正 确 地 进行 。 


设计 审查 另外 的 成 果 应 该 是 一 份 行动 清单 列表 。 人 列表 包括 设计 审查 所 讨论 的 每 一 处 修改 或 改动 ， 并 且 对 其 中 每 个 行动 项 都 要 
给 出 最 后 期 限 并 指定 给 某 个 人 ， 这 个 人 应 负责 改动 ， 并 测试 其 影响 ， 然 后 向 所 有 参与 者 报告 进度 。 


64 ”其 他 注意 事项 


在 数据 库 设 计 审查 准备 和 进行 过 程 中 ， 可 能 还 有 其 他 注意 事项 和 间 题 需要 处 理 。 因 此 ， 必 须 做 好 准备 以 适应 各 种 情况 、 人 员 
和 企业 不 断 变化 的 需求 。 


本 节 主 要 针对 两 个 注意 事项 ， 第 一 个 是 如 何 克 服 潜在 的 危险 : 与 处 于 异地 的 工作 人 员 合作 ; 第 二 个 问题 更 多 的 是 机 遇 : 通过 
设计 审查 来 指导 初级 员工 。 


6.4.1 ”应 对 远程 工作 人 员 
在 某 些 情况 下 ， 企 业 会 有 一 些 分 散 的 员工 、DBA 和 开发 人 员 不 在 同一 地 点 。 有 远程 工作 人 员 时 ， 设 计 审 查 过 程 也 就 成 为 该 
开发 项 目 尤 其 重要 的 一 环 ， 因 为 它 迫 使 那些 每 天 无 法 互动 的 人 员 进 行 交流 。 


当然 ， 分 散 的 员工 会 使 设计 审查 变 得 复杂 。 尽 管 团队 成 员 可 以 飞 到 某 个 地 方 去 参加 设计 审查 ,但 是 成 本 上 也 是 不 划算 的 。 通 
过 设置 电话 会 议 、 视 频 会 议 或 网 络 会 议 (如 Live Meeting 或 WebEx) ， 可 以 让 每 一 位 参与 者 都 能 来 到 同一 个 虚拟 的 房间 进行 设 
计 审 查 。 但 是 这 种 情况 下 ， 所 有 资料 都 应 在 开会 前 准备 妥当 ， 这 样 每 一 位 参与 者 都 可 以 事先 了 解 要 审查 的 内 容 。 


无 论 如何 ， 不 能 假设 所 有 参加 设计 审查 的 成 员 都 在 同一 地 方 。 


6.4.2 ”制度 和 知识 迁移 
设计 审查 会 议 可 以 说 是 一 次 指导 初级 职员 的 绝 好 机 会 。 参 加 会 议 的 都 是 高 级 技术 人 员 ， 其 中 大 多 具有 教学 能 力 。 邀 请 初级 职 
R (善于 接受 新 的 想法 的 人 ) 到 场 ， 无 形 中 传递 了 知识 ， 既 高 效 又 节约 成 本 。 


尽管 如 此 ， 也 不 能 将 会 议 变 成 单纯 的 教育 课程 。 此 外 ， 不 要 让 初级 人 员 的 问题 扰乱 了 会 议 ， 也 不 要 让 高 级 人 员 将 会 议 看 作 一 


个 临时 的 演讲 台 。 


设计 审查 的 目的 是 要 确保 新 的 应 用 程序 和 数据 库 对 于 企业 的 可 行 性 ， 但 通常 也 可 以 兼作 一 些 指导 。 
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设计 审查 既 费 时 又 难以 管理 ， 但 值得 去 做 。 如 果 建 立 并 遵循 一 套数 据 库 应 用 程序 设计 审查 的 系统 化 方法 ， 部 署 最 佳 应 用 程序 
的 可 能 性 也 会 增加 。 数 据 库 开 发 可 能 非常 复杂 ， 只 有 对 部 署 的 过 程 进行 管理 和 记录 ， 才 能 确保 创建 成 功 且 有 用 的 应 用 系统 。 设 计 
审查 的 过 程 是 一 种 有 效 的 方式 ， 可 以 激励 严格 、 系 统 的 数据 库 应 用 程序 在 部 署 前 后 的 审查 。 


6.6 回顾 


1. 说 出 每 种 设计 审查 所 需 的 角色 。 

2. 逻 辑 设计 审查 和 物理 设计 审查 的 区 别 是 什么 ? 

3. 非 规范 化 应 在 哪 种 类 型 的 设计 审查 过 程 中 讨论 ? 

4. 为 什么 除了 审查 SQL， 应 用 程序 代码 的 审查 也 很 重要 ? 

5.ADLC 的 哪个 阶段 要 进行 部 署 前 的 设计 审查 ? 

6. 在 哪 种 类 型 的 设计 审查 过 程 中 要 检查 是 否 满足 第 三 范式 ? 

7. 举 例 说 明 ， 为 什么 设计 审查 要 包括 应 用 程序 开发 管理 的 代表 ? 

8. 每 一 种 设计 审查 需要 什么 样 的 输出 ? 

9. 在 哪 种 类 型 的 设计 审查 过 程 中 确定 并 分 析 应 用 程序 对 公司 的 计算 资源 造成 的 影响 ? 


10. 为 什么 要 由 DBA 领 导 大 部 分 的 设计 审查 ? 


6.7 ”推荐 书目 


DeMarco, Tom, and Timothy Lister. Peopleware: Productive Projects and 
Teams. New York, NY: Dorset House (1987). ISBN 0-932633-05-6. 

Freedman, Daniel P., and Gerald M. Weinberg. Handbook of Walk- 
throughs, Inspections, and Technical Reviews. New York, NY: Dorset 
House (1990). ISBN 0-932633-19-6. 

Ginac, Frank P. Creating High Performance Software Develop- 
ment Teams. Upper Saddle River, NJ: Prentice Hall (2000). ISBN 
0-13-085083-7. 

Rothstein, Michael F., and Burt Rosner. The Professional’s Guide to Data- 
base Systems Project Management. New York, NY: John Wiley & Sons 
(1990). ISBN 0-471-62130-7. 


第 7 草 QUEERS Se 


虽然 是 陈 词 滥 调 了 ， 但 这 是 事实 ， 在 当今 复杂 的 商业 环境 中 变化 是 唯一 不 变 的 。 瞬 息 万 变 的 市 场 导致 企业 必须 不 断 进 行 调 
整 。 企业 都 在 努力 满足 不 断 变化 的 客户 期 望 ， 同 时 努力 维持 收入 增长 和 盘 利 能 力 。 与 此 同时 ， 企 业 必须 不 断 地 更 新 和 提高 产品 和 
服务 ， 以 满足 并 超越 竞争 对 手 。 


在 当今 复杂 的 商业 环境 中 变化 是 唯一 不 变 的 。 


此 外 ， 企 业 中 的 人 们 通常 认为 变化 难以 管理 。 变 化 通常 意味 着 额外 的 角色 和 责任 ， 几 乎 不 可 避免 地 使 我 们 的 工作 变 得 更 加 困 
难 。 我 们 舒适 的 小 现状 将 不 复 存 在 ， 因 此 ， 我 们 也 必须 改变 ， 要 么 改变 环境 ， 要 么 改变 做 事 的 方式 。 特 别 是 对 于 IT， 管 理 变 更 有 
许多 不 同 的 要 素 。 下 面 的 每 一 项 都 构成 “变更 管理 ”经 验 的 不 同方 面 : 


- 工作 环境 或 工作 场所 的 改变 ， 以 容纳 更 多 的 员工 、 更 少 的 员工 ， 或 只 是 拥有 新 的 、 不 同 技能 的 不 同 员工 。 

. 组 织 的 改变 ， 如 流程 或 方法 ， 例 如 ， 必 须 做 出 调整 以 促进 产品 和 服务 交付 的 步伐 更 快 。 

网 络 基础 设施 的 改变 ， 为 越 来 越 多 并 且 地 理 位 置 上 或 许 更 为 分 散 的 员工 提供 支持 。 

. 应 用 程序 和 系统 的 改变 ， 以 现 有 的 数据 来 执行 不 同 的 进程 ， 或 包括 更 多 不 同类 型 的 数据 。 

. 数据 的 类 型 和 结构 改变 ， 需 要 对 底层 数据 库 模 式 进行 修改 来 适应 新 的 数据 。 
为 了 企业 的 生存 和 成 功 ， 改 变 不 可 避免 却 很 必要 。 有 很 多 因素 共同 迫使 数据 库 结构 的 改变 。 包 括 : 
很 多 因素 共同 迫使 数据 库 结 构 的 改变 。 

需要 改变 额外 的 或 修改 的 数据 元 素 的 应 用 程序 。 

* 性 能 的 修改 和 调整 ， 使 数据 库 应 用 程序 的 运行 速度 更 快 。 

* 管理 的 改变 要 求 存储 新 类 型 的 数据 或 相同 的 数据 存储 更 长 的 时 间 。 

商业 惯例 的 改变 ， 需 要 新 的 类 型 的 数据 。 

* 技术 的 改变 ， 使 得 数据 库存 储 新 类 型 的 数据 并 且 比 以 前 存储 的 数据 更 多 。 


变化 永远 不 会 消失 。 因 此 ， 当 务 之 急 是 寻找 能 够 更 好 地 管理 这 些 不 可 避免 的 变化 的 解决 方案 。 


71 变更 管理 要 求 
要 成 功 地 实施 高 效 的 变更 管理 ， 有 必要 了 解 一 些 基 本 要 求 。 为 了 确保 成 功 ， 需 要 将 以 下 因素 纳入 变更 的 管理 规范 中 : 积极 
性 、 智 慧 、 分 析 (规划 和 影响 ) 、 自 动 化 、 标 准 化 、 可 靠 性 、 可 预测 性 ， 以 及 快速 而 高 效 的 交付 。 
精心 策划 的 变更 可 以 节约 时 间 。 


积极性， 主动 的 变更 〈 可 以 消除 未 来 的 问题 ) 是 一 家 企业 最 有 价值 的 改变 类 型 。 在 整个 开发 周期 ， 所 需 的 变更 确定 并 实施 


的 越 早 ， 变 更 的 总 成 本 就 越 低 。 


智慧， 实施 变更 时 ， 方 方面 面 都 要 考虑 到 ， 因 为 它 可 能 为 公司 带 来 不 可 预见 的 费用 。 必 须 对 每 种 变更 的 影响 进行 仔细 的 研 
究 然后 纳入 变更 过 程 ， 因 为 一 个 地 方 的 简单 的 变更 可 能 会 引起 其 他 地 方 的 复杂 的 变更 。 变 更 管理 过 程 中 的 智慧 往往 需要 进行 彻底 


的 分 析 ， 包 括 高 效 且 低 风险 的 实施 计划 。 真 正 的 智慧 还 需要 制定 一 项 应 急 计 划 ， 以 防 变更 没有 按 预 期 执行 。 


. 规划 分 析 ， 规 划 使 变更 的 有 效 性 最 大 化 。 一 项 精心 策划 的 变更 可 以 节约 时 间 。 通 常 第 一 次 做 就 要 做 好 ， 而 不 是 在 第 一 次 变 
更 不 理想 的 情况 下 再 次 去 做 。 高 效 的 企业 在 分 配 资源 实施 某 个 变更 之 前 ， 已 经 对 每 个 变更 产生 的 影响 都 有 了 彻底 的 理解 。 


影响 分 析 ， 综 合 的 影响 和 风险 分 析 人 允许 企业 对 整个 问题 以 及 所 涉及 的 风险 进行 仔细 的 研究 ， 以 确定 行动 的 最 佳 方案 。 一 个 
变更 通常 可 以 使 用 多 种 不 同 的 方式 完成 。 然 而 ， 每 个 变更 的 影响 可 能 有 相当 大 的 差别 。 某 些 变更 会 有 许多 风险 : 失败 、 难 度 太 
大 、 需 要 其 他 变更 、 停 机 等 。 在 确定 实施 变更 的 最 佳 方式 时 ， 所 有 的 注意 事项 都 很 重要 。 


自动化， 资源 有 限 工 作 量 却 在 日 益 增 加 ， 将 变更 过 程 自动 化 有 助 于 减少 人 为 误差 ， 从 而 为 不 堪 重 负 的 人 们 消除 更 多 烦琐 的 
工作 。 


- 流程 标准 化 ， 减 员 、 职 务 升 迁 和 职务 的 变更 需要 企业 规范 流程 以 满足 持续 的 生产 力 水 平 。 通 过 一 种 有 条 理 的 、 完 整 记 录 的 
方式 来 完整 一 项 任务 ， 不 仅 可 以 减少 学 习 上 的 谊 路 ， 还 可 以 减少 培训 时 间 。 


* 可 靠 和 可 预测 的 过 程 ， 创 建 任何 可 交付 的 产品 时 ， 企 业 需 要 知道 其 花费 的 精力 不 会 浪费 。 因 为 时 间 是 宝贵 的 ， 高 水 平 的 可 
预测 性 将 有 助 于 确保 持续 的 成 功 和 盈利 。 可 靠 性 和 可 预测 性 是 生产 品质 始终 如 一 的 产品 的 关键 因素 。 


- 可 用 性 ， 大 多 数 的 变更 都 需要 停机 才能 实施 。 应 用 程序 必须 停 下 来 ， 数 据 库 也 一 样 。 然 而 ， 现 在 高 可 用 性 对 于 大 多 数 应 用 
程序 都 是 必需 的 ， 特 别 是 电子 商务 。 这 正在 迅速 成 为 一 个 互联 网 时 代 的 要 求 。 减 少 变 更 实施 的 停机 时 间 将 会 增加 应 用 程序 的 可 用 
性 。 


* 快速 而 高 效 的 交付 ， 消 费 者 要 求 大 多 数 的 产品 和 服务 能 够 快速 更 新 换代 。 最 先 推 向 市 场 的 产品 是 最 能 各 利 的 产品 。 相 反 ， 
缓慢 或 低 效 率 交付 的 产品 的 成 本 将 是 巨大 的 。 因 此 ， 实 施 变更 ， 越 快 越 好 。 完 成 变更 需要 中 断 的 时 间 越 短 ， 系 统 推 向 市 场 的 速度 
就 越 快 。 


DBA 的 变更 管理 视角 


DBA 是 数据 库 变更 的 监护 人 。 而 DBA 却 通常 不 是 变更 的 发 起 人 ， 发 起 人 是 程序 员 、 应 用 程序 所 有 者 或 业务 用 户 。 尽 管 如 
此 ， 有 时 DBA 也 会 发 起 变更 ， 例 如 ， 为 了 解决 性 能 问题 或 使 用 新 功能 或 新 技术 。 不 管 怎样 ， 无 论 谁 是 变更 的 发 起 人 ，DBA 都 负 
责 进 行 数据 库 的 变更 ， 并 确保 每 个 变更 都 能 成 功 进行 而 不 对 数据 库 的 其 余部 分 造成 影响 。 


DBA 是 数据 库 变 更 的 监护 人 。 


为 了 对 数据 库 进 行 高 效 的 修改 ，DBA 需 要 考虑 在 7.1 节 讨论 的 每 一 项 : PRE. BS. DT (规划 和 影响 ) 、 自 动 化 、 标 准 
化 、 可 靠 性 、 可 预测 性 ， 以 及 快速 而 高 效 的 交付 。 如 果 没 有 一 个 强 有 力 的 、 经 过 时 间 考 验 的 流程 来 实施 数据 库 的 变更 ，DBA 的 
工作 将 非常 困难 。 为 什么 呢 ? 


当今 主流 的 DBMS 产 品 不 支持 快速 而 高 效 的 数据 库 结构 变更 。 每 个 DBMS 都 对 其 数据 库 的 变更 提供 了 不 同 程度 的 支持 ， 但 没 
有 哪个 可 以 轻松 支持 可 能 需要 的 所 有 类 型 的 变更 。 例 如 ， 当 今 大 多 数 DBMS 不 支持 将 某 列 简单 地 添加 到 现 有 行 的 中 间 。 为 了 做 到 
这 一 点 ，DBA 必 须 删 除 该 表 并 重新 创建 包含 该 列 的 表 。 但 是 数据 怎么 办 ? 删除 了 表 ， 数 据 也 删除 了 ， 除 非 DBA 足 够 聪明 想到 提 
前 印 载 数据 。 而 表 的 索引 又 怎么 办 ”它们 也 会 随 着 表 的 删除 而 删除 ， 因 此 ， 如 果 DBA 没 有 意识 到 而 没有 重新 创建 索引 ， 性 能 将 


受到 影响 。 数 据 库 安 全 也 是 如 此 : 删除 了 表 ， 表 所 有 的 安全 性 也 删除 了 。 而 这 只 是 难以 实施 和 管理 的 简单 变更 的 例子 中 的 一 个 。 


由 于 多 数 企 业 每 个 数据 库 都 至 少 保留 两 个 副本 (有 时 更 多 ) 的 困境 。 人 至少 一 个 测试 版 ,一 个 生产 版 ,但 也 可 能 有 多 个 测试 环 
境 (〈 例 如， 支持 并 发 开发 、 质 量 保证 、 单 元 测试 和 集成 测试 ) 。 每 个 数据 库 变更 不 仅 需 要 在 所 有 这 些 副本 中 进行 ， 最 终 还 要 在 生 
产 副 本 中 进行 。 此 外 ， 大 多 的 企业 拥有 多 个 DBMS 产 品 ， 每 个 产品 对 变更 的 支持 标准 也 不 尽 相同 。 现 在 ， 你 知道 数据 库 变更 是 如 
何 迅速 吞并 DBA 的 时 间 了 吧 。 


7.2 ”变更 的 类 型 


管理 变更 是 DBA 工 作 中 的 重要 组 成 部 分 。 实 际 上 ， 如 果 系统 和 数据 库 安装 到 一 个 从 来 不 会 改变 的 环境 ， 那 么 DBA 大 多 数 的 
工作 也 会 消失 。 而 事实 并 非 如 此 。 业 务 的 变更 通常 会 使 应 用 程序 代码 或 数据 库 结 构 的 变更 很 有 必要 。 不 太 明显 的 业务 变更 同样 影 
响 数据 库 ， 例 如 ， 业 务 的 增长 以 及 更 多 用 户 的 增加 ， 有 额外 的 数据 存储 或 业务 量 增长 。 


业务 的 变更 通常 会 使 应 用 程序 代码 或 数据 库 结构 的 变更 很 有 必要 。 


7.2.1 DBMS 软 件 


正如 第 2 章 所 讨论 的 ，DBA 必 须 准备 好 管理 DBMS 版 本 的 迁移 。 从 DBMS 的 一 个 版 本 到 另 一 个 版 本 涉及 的 复杂 性 在 于 新 版 本 
支持 的 新 特性 和 新 功能 。 如 果 后 来 的 版 本 删除 了 某 些 功能 ， 复 杂 性 就 会 增加 ， 因 为 如 果 某 些 数据 库 和 程序 使 用 了 这 些 删 除 的 功 
能 ， 它 们 可 能 也 需要 进行 变更 。 此 外 ， 由 于 DBMS 功 能 的 添加 和 删除 ，DBA 必 须 创 建 正确 使 用 每 个 新 的 DBMS 功 能 的 准则 和 规 
程 。 正 如 第 2 章 的 深入 讨论 ， 管 理 变更 的 这 个 方面 是 DBA 工 作 中 的 重要 组 成 部 分 。 


7.2.2 ”硬件 配置 
DBMS 可 能 需要 进行 硬件 升级 或 配置 变更 。 也 期 望 DBA 能 与 系统 编程 人 员 和 管理 人 员 一 同 负责 硬件 的 设置 和 维护 工作 。 有 
时 ，DBMS 需 要 的 配置 可 能 与 常用 的 配置 不 同 ， 因 此 需要 DBA 向 SA 了 解 需要 这 种 非 标 准 配置 的 原因 。 


相反 ， 其 他 原因 的 硬件 变更 ，DBMS 的 配置 也 不 得 不 相应 改变 。 你 的 企业 或 许 正在 改变 用 于 数据 库 服务 器 硬件 上 的 磁盘 驱 
动 ,， 或 者 为 机 器 增加 额外 的 内 存 。 诸 如 此 类 的 硬件 变更 可 能 也 需要 对 数据 库 结 构 和 DBMS 配 置 进行 变更 。DBA 必 须 与 负责 DBMS 
所 用 硬件 的 配置 与 维护 工作 的 SA 团队 积极 合作 ， 并 且 如 前 面 所 讨论 的 ， 除 了 承担 DBA 的 职责 ， 甚 至 还 要 承担 SA 的 职责 。 


7.2.3 ”逻辑 和 物理 设计 


数据 库 变更 时 ， 重 要 的 是 定义 数据 库 的 蓝图 也 随 之 改变 。 这 意味 着 你 需要 将 概念 和 逻辑 数据 模型 与 物理 数据 库 进 行 同步 。 可 
以 通过 几 种 方式 实现 。 


数据 库 变 更 时 ， 重 要 的 是 定义 数据 库 的 蓝图 也 随 之 改变 。 


善于 数据 管理 的 企业 可 能 选择 首先 在 概念 和 逻辑 层面 进行 变更 ， 然 后 将 变更 转移 到 物理 数据 库 。 通 常 ， 那 样 的 方式 需要 使 用 
数据 建 模 工具 来 分 离 逻 辑 和 物理 模型 。 此 外 ， 程 序 必 须 使 每 个 层面 变更 的 规范 更 容易 ， 同 时 还 要 能 够 同步 不 同 的 模型 : 从 逻辑 到 
物理 ， 反 之 从 物理 到 逻辑 。 


当 缺 乏 强大 的 数据 建 模 工具 时 ， 用 来 同步 模型 的 典型 方式 就 是 人 工 了 。 当 对 物理 数据 库 进 行 修改 时 ， 【1]DBA 必 须 手动 更 新 
逻辑 数据 模型 (或 许 还 有 概念 数据 模型 ) 。 这 样 的 努力 需要 一 种 严格 的 方式 来 改变 传播 。 与 任何 一 种 手动 变更 管理 方案 一 样 ， 这 
种 方式 既 烦 琐 又 容易 出 错 。 但 是 ， 必 须要 将 逻辑 模型 与 物理 数据 库 进 行 同步 。 否 则 ， 数 据 模型 作为 数据 库 开发 蓝图 的 用 处 也 会 失 
效 。 


四 物理 变更 〈 如 增加 存储 ) 有 可 能 不 需要 在 逻辑 和 概念 数据 模型 中 记录 ， 因 为 数据 库 的 菜 些 物理 特征 与 这 些 模 型 不 相关 。 然 
而 ， 其 他 变更 ， 如 修改 数据 类 型 或 添加 新 的 列 ， 都 需要 在 逻辑 和 概念 数据 模型 中 有 所 反映 。 


7.2.4 ”应 用 程序 


应 用 程序 变更 需要 与 数据 库 变更 同步 。 然 而 ， 说 起 来 容易 做 起 来 难 。 当 对 物理 数据 库 结构 进行 变更 时 ， 应 用 程序 变更 都 会 伴 
随 着 发 生 。 例 如 ， 简 单 地 添加 一 列 到 数据 库 表 ， 应 用 程序 软件 就 需要 对 此 列 的 数据 进行 填充 、 修 改 和 报告 。 


应 用 程序 变更 需要 与 数据 库 变 更 同步 


当 数 据 库 变更 转移 到 生产 环境 时 ， 应 用 程序 变更 也 必须 一 起 转移 ， 否 则 会 使 数据 库 变更 无 效 。 当 然 ，DBA 可 以 让 数据 库 变 
更 的 转移 早 于 应 用 程序 变更 ， 以 确保 数据 库 结 构 正确 地 指定 。 在 生产 环境 变更 数据 库 之 后 ，DBA 会 检查 数据 库 的 准确 性 ， 然 后 
才 人 允许 应 用 程序 变更 转移 。 


但 是 数据 库 变更 和 应 用 程序 变更 之 间 的 天 系 是 有 效 的。 如 果 应 用 程序 变更 取消 ， 那 么 数据 库 变更 也 应 取消 ， 反 之 亦 然 。 未 能 
同步 变更 将 有 可 能 导致 应 用 程序 错误 或 低 效 。DBA 必 须 了 解 这 些 关 系 并 对 变更 管理 的 过 程 进行 监控 ， 以 确保 数据 库 和 应 用 程序 
的 变更 保持 一 致 。 


7.2.5 ”物理 数据 库 结构 


对 于 DBA， 最 复杂 且 最 耗 时 的 变更 类 型 是 计划 、 分 析 和 实施 物理 数据 库 结构 的 变更 。 但 大 多 数 的 数据 库 变更 都 会 超时 (SE 
际 上 ， 实 施 时 仍 保持 静态 的 数据 库 非 常 少见 ) 。 因 此 ，DBA 必 须 做 好 准备 在 他 们 的 监控 下 进行 数据 库 的 变更 。 有 些 变更 易于 实 
施 ， 而 有 些 却 很 复杂 、 容 易 出 错 目 耗 时 。 本 章 其 余部 分 会 讨论 物理 数据 库 对 象 如 何 进行 变更 ， 以 及 在 此 过 程 中 DBA 可 能 会 遇 到 


的 问题 。 


对 于 DBA， 最 复杂 的 变更 类 型 是 物理 数据 库 结构 的 变更 。 


7.3 ”数据 库 结构 变更 的 影响 


当 企业 的 数据 需求 改变 时 ， 用 于 存储 数据 的 数据 库 也 要 改变 。 如 果 数 据 不 可 靠 且 不 可 用 ， 系 统 就 不 会 为 业务 服务 (相反 ， 还 
会 对 业务 的 健康 构成 威胁 ) 。 因 此 ， 需 要 绝对 可 靠 的 技术 管理 数据 库 变更 。 但 更 重要 的 是 ， 需 要 的 技术 不 仅 要 绝对 安全 ， 还 要 是 
自动 的 、 高 效 的 且 易 于 使 用 的 。 遗 憾 的 是 ， 当 今 的 数据 库 系 统 在 管理 数据 库 变更 方面 都 进行 得 不 容易 。 


创建 天 系数 据 库 实 用 的 是 数据 定义 语言 (DDL) 。DDL 由 三 个 SQL 动词 组 成 : CREATE、DROP 和 ALTER。CREATE 语 句 用 于 
最 初创 建 数据 库 对 象 ，DROP 语 句 用 于 从 系统 删除 数据 库 对 象 ，ALTER 语 句 用 于 修改 数据 库 对 象 。 


并 不 是 数据 库 对 象 的 每 一 方面 都 可 以 使 用 ALTER 语 句 修 改 。 有 些 类 型 的 变更 需要 删除 数据 库 对 象 然后 重新 创建 带 有 新 参数 的 
对 象 。 各 个 DBMS 有 关 ALTER 可 用 于 什么 变更 的 确切 说 明 各 不 相同 。 


例如 ， 你 可 以 使 用 ALTER 语 句 为 一 个 已 有 的 表 添 加 列 ， 但 通常 只 在 表 的 末尾 。 换 句 话说 ，ALTER 不 能 用 于 在 两 个 已 有 的 列 中 
间 添 加 新 列 。 此 外 ， 通 常 不 可 以 从 表 中 删除 列 。 在 表 的 末尾 以 外 的 任何 地 方 添加 列 ， 或 删除 列 ， 都 必须 首先 删除 表 然 后 重新 创建 
包含 期 望 结 果 的 表 。 有 关 ALTER 语 句 可 以 改变 什么 ， 每 个 DBMS 都 有 局 限 性 。 此 外 ， 不 只 是 表 ， 大 多 数 的 数据 库 对 象 的 某 些 方面 
都 不 可 以 通过 使 用 ALTER 改 变 。 


当 数 据 库 的 变更 需要 删除 或 重建 某 个 对 象 时 ，DBA 必 须 应 对 级 联 式 DROP 效 应 。 级 联 式 DROP 是 指 删 除 高 级 别 的 数据 库 对 象 
所 产生 的 效应 : 所 有 低级 别 的 数据 库 对 象 也 将 删除 。 ( 见 图 7-1 有 关 数 据 库 对 象 层次 结构 的 描述 。) 因此 ， 如 果 删 除 一 个 数据 
库 ， 该 数据 库 中 定义 的 所 有 对 象 也 将 删除 。 级 联 式 DROP 效 应 使 变更 数据 库 模 式 的 工作 变 得 复杂 。 
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图 7-1 数据 库 对象 的 层次 结构 


级 联 式 DROP 效 应 使 变更 数据 库 模 式 的 工作 变 得 复杂 。 


为 了 解 其 中 的 复杂 性 ， 现 举例 说 明 。 假 设 你 在 使 用 DB2， 现 在 需要 将 分 段 表 空间 变更 为 分 区 表 空 间 。 要 做 到 这 一 点 ， 你 必须 
首先 删除 分 段 表 空 间 然后 重建 分 区 表 空 间 。 而 当 删 除 分 段 表 空间 时 ， 同 时 也 删除 了 定义 在 该 表 空 间 的 所 有 表 ， 表 的 列 和 码 ， 这 些 


表 上 上 所 有 的 索引 、 触 发 器 ， 为 表 定 义 的 所 有 同义词 ， 以 及 访问 该 表 的 所 有 视图 。 此 外 ， 当 删除 数据 库 对 象 时 ， 系 统 的 安全 信息 和 
数据 库 统计 也 将 删除 。DBA 必 须 能 够 在 删除 表 空 间 前 捕捉 所 有 这 些 信息 ， 以 便 在 分 区 表 空 间 实施 之 后 还 能 重建 这 些 信息 。 修 改 
完成 后 ， 从 系统 目录 或 数据 字典 捕捉 DDL 并 确保 DDL 提 交 正 确 ， 这 将 是 一 个 烦琐 、 复 杂 且 容易 出 错 的 过 程 。 


系统 目录 或 数据 字典 存储 着 每 一 个 数据 库 对 象 的 元 数据 。 元 数据 包含 的 不 止 数据 库 对 象 的 物理 特性 ， 还 与 元 数据 一 并 存储 了 
数据 库 对 象 的 其 他 信息 如 安全 授权 和 数据 库 统计 。 重 建 任何 数据 库 对 象 需要 的 所 有 信息 都 一 应 俱全 ， 只 要 你 知道 到 哪里 寻找 ， 这 
也 是 DBA 工 作 的 一 部 分 。 


有 关 数 据 库 变更 的 最 后 一 个 顾虑 是 : 应 用 程序 规范 发 生 了 什么 ? 当 删 除 程序 访问 的 数据 库 对 象 时 ，DBMS 可 能 会 认为 该 程序 
无 效 。 在 程序 访问 的 数据 库 对 象 重建 之 后 ， 可 能 需要 额外 的 步骤 来 将 应 用 程序 重新 绑 定 到 DBMS， 这 取决 于 DBMS 和 程序 的 类 


型 。 


7.3.1 ALTER 的 限制 


许多 类 型 的 数据 库 对 象 使 用 基本 的 SQL ALTER 语 句 无 法 进行 改变 ， 当 然 ， 这 对 于 各 DBMS 以 及 单个 DBMS 的 各 版 本 也 不 尽 相 
同 。 但 ALTER 最 不 可 能 支持 的 动作 有 : 


" 变更 数据 库 对 象 的 名 称 (有 些 DBMS 和 版 本 ， 一 些 对 象 可 以 使 用 RENAME 语 和 句 重 命名 ) 。 


+ 将 数据 库 对 象 转移 到 另外 的 数据 库 。 


" 变更 表 空 间 分 区 的 数目 或 数据 文件 。 


" 从 分 区 表 空 间或 索引 中 删除 一 个 分 区 。 


* 将 表 从 一 个 表 空间 转移 到 另 一 个 表 空 间 。 


* 将 表 的 列 重新 排序 。 


" 变更 列 的 数据 类 型 和 长 度 (尤其 对 于 较 小 的 长 度 ) 。 


“ 从 表 删 除 列 。 


" 变更 主 码 或 外 码 的 定义 。 


:为 表 添加 非 空 列 。 


- 为 视图 添加 或 删除 列 。 


. 变更 视图 基于 的 SELECT 语句 。 


变更 索引 的 列 。 


" 变更 无 论 索 引 是 否 唯一 。 


" 变更 无 论 索 引 是 否 集群 。 


* 变更 无 论 索 引 升 序 或 降序 。 


“ 修改 触发 器 的 内 容 。 
变更 散 列 码 。 


在 少数 情况 下 ， 某 种 类 型 的 列 的 长 度 可 能 使 用 ALTER 改 变 。 例 如 ， 在 DB2 和 Oracle 中 ， 你 可 以 将 一 个 字符 类 型 的 列 改 得 更 大 
却 不 能 更 小 。 此 外 ， 也 可 能 将 某 列 从 数字 数据 类 型 改 为 其 他 。DB2 人 允许 列 数据 类 型 的 修改 ， 只 要 变更 发 生 在 同一 个 数据 类 型 家 族 
(数字 到 数字 ， 字 符 到 字符 ， 或 日 期 到 日 期 ) 。 例 如 ， 使 用 ALTER 将 某 列 从 SMALLINT 改 为 INTEGER 是 合法 的 ， 而 从 SMALLINT 
改 为 DATE 就 是 不 合法 的 。 但 是 在 一 般 情 况 下 ， 列 的 数据 类 型 和 长 度 的 重大 变更 通常 需要 将 表 删 除 ， 然 后 重建 具有 新 的 数据 类 型 
和 长 度 的 表 。 


对 实际 的 数据 库 对 象 进行 的 物理 变更 仪 是 数据 库 变更 的 一 个 方面 。 无 数 的 工作 都 需要 DBA 修 改 和 转移 数据 库 的 结构 。 保 持 
测试 数据 库 同步 并 可 用 于 应 用 程序 的 测试 是 一 个 严峻 的 挑战 。DBA 必 须 制 定 强大 的 程序 通过 复制 主 测试 结构 来 创建 新 的 测试 环 
境 。 此 外 ，DBA 可 能 还 需要 创建 脚本 ， 在 测试 开始 前 以 特定 的 方式 建立 数据 库 。 脚 本 一 旦 创建 ， 便 可 交 给 应 用 程序 开发 人 员 在 


需要 时 运行 。 
对 实际 的 数据 库 对 象 进行 的 物理 变更 仅 是 数据 库 变 更 的 一 个 方面 。 


另 一 个 挑战 是 恢复 指定 不 当 的 数据 库 变更 ， 或 取消 到 前 一 个 时 间 点 的 迁移 。 这 些 任 务 非常 复杂 ， 并 且 需 要 了 解 变更 或 迁移 前 
后 的 数据 库 环 境 。 


前 面 的 讨论 证 明了 购买 数据 库 变更 管理 工具 来 简化 和 自动 化 数据 库 变更 管理 是 合理 的 。 记 住 ， 前 面 列 出 的 那些 项 并 不 详尽 ， 
而 且 也 会 因 DBMS 而 有 所 不 同 。 有 了 DBA 工 具 管 理 变更 过 程 ，DBA 可 以 轻松 地 指向 并 点 击 以 指定 某 个 变更 。 该 工具 还 处 理 变 更 
的 所 有 细节 。 因 此 ， 工 具 减 轻 了 DBA 肩 上 的 重担 并 确保 数据 库 对 象 的 变更 不 会 引起 其 他 隐 式 变更 。 数 据 库 变 更 管理 工具 提供 的 
功能 


` 确定 需要 变更 什么 所 需 的 时 间 减 少 。 

:分析 数据 库 变更 的 影响 的 方法 更 简单 、 更 讲究 。 

* 创建 、 修 改 和 删除 数据 库 对 象 要 求 的 技术 知识 水 平 有 所 降低 。 
` 能 够 一 直 跟 踪 所 有 变更 。 

通过 减少 应 用 程序 运行 变更 的 时 间 ， 增 加 应 用 程序 的 实用 性 。 


数据 库 变更 管理 工具 是 大 多 数 企业 部 署 任何 规模 的 数据 库 时 最 先 获得 的 工具 之 一 。 该 工具 减少 了 管理 数据 库 变更 的 时 间 、 精 
力 和 人 为 错误 。 变 更 管理 工具 的 使 用 增加 了 速度 和 准确 性 ， 因 此 为 企业 带 来 即时 的 投资 回报 。 有 关 该 DBA 工 具 的 更 多 信息 请 见 
第 23 章 。 


7.3.2 ”数据 库 变更 业务 场景 


在 数据 库 的 整个 生命 周期 ，DBA 需 要 进行 多 种 不 同类 型 的 变更 。 有 些 比 较 简单 且 容 易 实施 ， 有 些 则 比较 困难 且 复 杂 。 


如 前 所 述 ，SQL ALTER 语 句 可 用 于 多 种 类 型 的 数据 库 变更 。 而 其 他 类 型 的 变更 可 能 还 需要 额外 的 步骤 实施 。 了 解 进行 任何 
类 型 的 数据 库 变更 的 最 佳 方式 也 是 DBA 的 工作 。 请 记 住 ， 简 单 的 数据 库 变更 在 现实 世界 往往 会 变 得 更 困难 。 例 如 ， 当 一 个 数据 
库 变 更 涉及 多 个 地 点 不 同 服务 器 上 的 多 个 数据 库 时 ， 原 本 简单 的 变更 也 就 不 那么 简单 了 。 


当 一 个 数据 库 变 更 涉及 多 个 地 点 不 同 服务 器 上 的 多 个 数据 库 时 ， 原 本 简单 的 变更 也 就 不 那么 简单 了 。 
手动 实施 一 个 复杂 的 变更 (如 删除 或 重 命名 列 ) 可 能 需要 数 小 时 ， 变 更 一 个 列 的 名 称 可 能 需要 从 开发 环境 到 测试 环境 再 到 生 
产 环境 安排 、 运 行 和 验证 数 以 百 计 的 变更 。 应 对 这 些 挑战 也 是 DBA 的 工作 。 
一 些 数 据 库 变更 的 例子 
添加 一 个 新 列 到 表 的 末尾 通常 是 一 种 简单 的 变更 。 实 施 该 变更 只 需 一 个 ALTER 语 名 就 可 以 做 到 ， 如 : 
ALTER TABLE Table_1 
ADD COLUMN new_column INTEGER NULL 
添加 一 个 新 列 到 表 的 末尾 通常 是 一 种 简单 的 变更 。 


该 变更 可 以 通过 一 种 直接 的 方式 完成 〈 通 过 发 出 一 个 SQL 语句 ) 。 只 是 新 增 了 一 个 可 为 空 的 整数 列 到 Table 1。 然而， 进行 
变更 简单 ， 跟 踪 变 更 却 有 一 些 复杂 。 跟 踪 数 据 库 变更 越 来 越 困 难 ， 因 为 数据 库 环 境 增多 了 ， 变 更 所 需 的 延迟 也 增加 了 。 换 句 话 
说 ， 在 三 个 月 时 间 内 将 一 个 简单 的 变更 植 入 20 种 不 同 的 数据 库 环 境 中 越 来 越 复杂 ， 因 为 DBA 必 须 能 够 跟踪 哪些 变更 发 生 在 哪个 
环境 。 此 外 ， 通 常会 有 多 个 变更 需要 跟踪 。 


跟踪 数据 库 变更 越 来 越 困难 ， 因 为 数据 库 环境 增多 了 ， 交 更 所 需 的 延迟 也 增加 了 。 


稍微 有 些 困难 的 变更 是 修改 数据 库 对 象 的 可 用 空间 量 。 该 变更 通常 可 以 通过 使 用 ALTER 语 句 实现 ， 但 在 ALTER 语 句 发 出 后 还 
需要 额外 的 工作 。 例 如 ， 考 虑 以 下 ALTER 语 句 : 


ALTER TABLESPACE TS1 
PCTFREE 25 


a 


该 语句 将 名 为 TS1 的 表 空 间 的 可 用 空间 百分比 变 为 25% (从 之 前 的 任何 值 ) 。 然 而 ，ALTER 语 句 发 出 后 额外 的 可 用 空间 不 会 
凭空 出 现 。 为 了 回收 该 表 空 间 的 可 用 空间 ，DBA 必 须要 在 成 功 发 出 ALTER 语 句 后 将 表 空 间 进行 重组 。 还 需要 额外 的 工作 来 确保 有 
足够 的 磁盘 空间 用 于 增加 了 的 可 用 空间 量 。 因 此 ，DBA 需 要 了 解 ALTER 语 句 对 于 可 能 修改 的 每 个 参数 所 产生 的 影响 。 此 
外 ，DBA 还 需要 了 解 什么 时 候 需 要 额外 的 工作 来 全 面 贯彻 落实 所 需 的 变更 。 


最 后 ， 介 绍 一 种 非常 困难 的 数据 库 变更 : 添加 一 列 到 表 的 中 间 。 实 施 这 样 的 变更 需要 深 谋 远虑 和 规划 ， 因 为 它 不 可 能 通过 一 
个 简单 的 ALTER 语 名 实现。 相反 ， 表 必须 要 删除 并 在 合适 位 置 的 表 重 新 创建 新 列 。 需 要 执行 以 下 步骤 : 


添加 一 列 到 表 的 中 间 是 一 种 非常 困难 的 变更 。 

1. 通 过 查询 系统 目录 或 数据 字典 检索 当前 表 的 定义 。 

2. 通 过 查询 系统 目录 或 数据 字典 检索 当前 指定 该 表 的 任何 视图 的 定义 。 

3. 通 过 查询 系统 目录 或 数据 字典 检索 当前 在 该 表 的 任何 索引 的 定义 。 

4 .通过 查询 系统 目录 或 数据 字典 检索 当前 在 该 表 的 任何 触发 器 的 定义 。 

5. 获 取 该 表 所 有 的 参照 约束 及 其 相关 的 表 ， 并 确定 表 一 旦 删除 ( 表 中 所 有 的 数据 将 删除 ) 对 它们 产生 的 影响 。 
6. 通 过 查询 系统 目录 或 数据 字典 检索 所 有 已 经 授 出 的 安全 授权 。 


7. 通 过 使 用 系统 目录 、 数 据 字 典 和 任何 方便 使 用 的 其 他 程序 文档 获得 访问 该 表 的 所 有 程序 列表 。 


8 . 印 载 表 中 的 数据 。 
9 删除 该 表 ， 同 时 删除 与 该 表 相 关 的 任何 视图 和 索引 ， 也 使 任何 应 用 程序 中 针对 该 表 的 任何 SQL 语句 变 为 无 效 。 
10. 通 过 由 系统 目录 获得 的 定义 重新 创建 包含 新 列 的 表 。 

11. 使 用 步骤 8 中 逢 载 的 数据 ， 重 新 加 载 表 。 

12 重新 创建 可 能 删除 的 任何 参照 约束 。 

13 .重新 创建 任何 触发 器 、 视 图 和 索引 , 

14 .重新 创建 步骤 6 获得 的 安全 授权 。 

15 .检查 每 一 个 应 用 程序 以 确定 ， 继 续 正常 运行 是 否 需要 变更 。 


可 以 清楚 地 看 到 ， 如 此 复杂 的 变更 需要 费 尽心 思 地 关注 细节 才能 确保 其 实施 正确 。 该 过 程 充满 潜在 的 人 为 错误 且 非 常 耗 时 。 
总 之 ， 要 有 效 地 制定 数据 库 变 更 ，DBA 必 须 了 解 他 们 管理 的 数据 库 之 间 的 错综复杂 的 关系 ， 并 对 他 们 使 用 的 DBMS 所 支持 的 变更 
类 型 有 相当 的 了 解 。 


[1] 此 处 ， 可 以 较 早 地 在 过 程 中 重建 索引 ， 例 如 ， 在 数据 加 载 之 前 。 这 取决 于 在 用 的 DBMS 何 时 构建 索引 的 效率 更 高 ， 数 据 加 载 之 


前 或 之 后 。 


7.3.3 ”比较 数据 库 结 构 


管理 多 个 数据 库 环境 时 ，DBA 可 能 需要 对 这 些 环境 进行 比较 。 变 更 通常 只 在 一 个 数据 库 环 境 进行 ， 比 如 ， 构 建 并 测试 应 用 
程序 的 测试 环境 。 变 更 充分 测试 之 后 ， 它 们 将 转移 到 下 一 个 环境 (也 许 是 QA) 进行 额外 的 质量 保证 测试 。 为 适当 地 迁移 所 需 的 
变更 ，DBA 必 须 能 够 识别 在 测试 环境 中 应 用 的 所 有 变更 。 


变更 迁移 的 一 种 方式 是 要 DBA 记 录 每 一 个 变更 ， 然 后 将 它们 逐一 复制 到 新 的 数据 库 环 境 。 然 而 ， 这 样 的 方式 可 能 效率 很 
低 。DBA 可 以 分 析 一 系列 的 变更 之 后 将 它们 压缩 为 一 个 变更 或 一 小 组 变更 ， 但 这 种 方式 仍然 很 耗 时 上 且 容 易 出 错 。 


另 一 种 方式 是 使 用 DBA 工 具 比较 数据 库 组 件 。 环 境 之 间 所 有 的 区 别 将 会 写 到 报告 中 ， 或 者 工具 干脆 自动 将 记录 的 数据 库 环 
境 结构 复制 到 另 一 个 数据 库 环 境 。 要 做 到 这 一 点 ， 工 具 可 以 使 用 系统 目录 、 数 据 字典 或 DDL 脚 本 对 物理 数据 库 进 行 比较 。 对 于 非 
常 复 杂 的 数据 库 的 实施 还 会 用 到 比较 工具 ， 因 为 从 一 个 环境 到 下 一 个 环境 跟踪 变更 非常 困难 。 并 且 设 计 的 环境 越 多 ， 变 更 管理 就 
越 困难 。 


使 用 DBA 工 具 比 较 数 据 库 组 件 。 


如 果 你 所 在 的 企业 没有 数据 库 变 更 管理 工具 ， 那 么 一 定 要 将 那些 用 于 创建 数据 库 的 DDL 脚 本 保存 下 来 并 适时 更 新 。 对 数据 库 
进行 的 每 一 个 变更 也 必须 在 DDL 脚 本 中 体现 。 请 记 住 ， 后 续 的 ALTER 语 句 可 以 改变 数据 库 却 不 能 改变 DDL 脚 本 。DBA 要 么 将 
ALTER 语 句 追加 到 适当 的 DDL 脚 本 ， 要 么 改变 DDL 脚 本 来 体现 ALTER 语 句 的 作用 。 但 两 种 方式 都 不 十 分 理想 : 对 于 第 一 种 ， 所 需 
的 变更 使 用 ALTER 不 可 能 实施 (需要 修改 DDL 脚 本 ) ; 而 对 于 第 二 种 ， 引 入 错误 的 可 能 性 很 高 ， 因 为 一 个 变更 进行 了 两 次 (一 次 
是 对 真正 的 数据 库 ， 另 一 次 是 对 保存 的 DDL 脚 本 ) 。 


如 果 不 存储 数据 库 对 象 的 DDL 脚 本 ， 那 就 要 学 会 如 何 查询 系统 目录 或 数据 字典 表 来 手动 重建 数据 库 的 DDL。 所 有 这 两 种 方 
xt, 保存 DDL 和 手动 重建 DDL， 都 容易 出 错 且 耗 时 。 


如 果 没有 某 些 比较 功能 ，DBA 必 须 跟踪 每 一 个 变更 并 准确 记录 哪些 环境 已 经 实施 了 变更 、 哪 些 环境 还 没有 实施 。 这 同样 很 
容易 出 错 。 如 果 DBA 的 记录 不 准确 ， 他 就 要 使 用 每 个 数据 库 环 境 的 系统 目录 或 数据 字典 ， 不 厌 其 烦 地 对 每 个 可 能 已 经 完成 变更 
的 数据 库 结 构 进行 检查 。 这 也 是 一 个 容易 出 错 且 耗 时 的 过 程 。 


7.3.4 ”请 求 数据 库 变 
应 用 程序 开发 团队 通常 会 请 求 数据 库 的 变更 。DBA 虽 然 是 数据 库 的 监护 人 ， 但 却 不 是 数据 库 的 主要 用 户 。 那 些 通过 应 用 程 
序 和 系统 访问 数据 的 商业 用 户 往往 才 是 数据 库 的 主要 用 户 。 


为 妥善 协调 数据 库 的 变更 ，DBA 团 队 必须 制定 策略 和 程序 来 管理 变更 的 请 求 和 实施 。 期 望 数 据 库 的 变更 能 够 立即 或 在 当天 
实施 是 不 合理 的 。 但 DBA 团 队 应 使 数据 库 变更 实施 的 期 限 合理 。 他 们 必须 研究 每 一 个 请 求 以 确定 其 对 数据 库 以 及 访问 数据 库 的 
应 用 程序 产生 的 影响 。 只 有 在 对 该 信息 进行 评估 之 后 ， 才 能 实施 数据 库 的 变更 。 


制定 策略 来 管理 变更 的 请 求 和 实施 。 


应 用 程序 开发 人 员 只 有 在 数据 库 变 更 被 视 为 必需 的 情况 下 才 提 出 数据 库 变更 的 请 求 。 换 名 话说， 应 用 程序 有 新 数据 的 使 用 需 
求 ， 而 数据 库 则 需要 变更 以 支持 这 些 需求 。 当 然 ， 并 不 是 每 一 个 请 求 都 将 按照 期 望 的 实施 ， 基 于 对 DBMS 的 了 解 ，DBA 可 能 需 


对 这 些 请 求 进行 一 些 修 改 。 


7.3.5 ”标准 化 的 变更 请 求 

DBA 团 队 应 建立 数据 库 变 更 实施 的 标准 化 表单 。 这 些 表单 应 为 每 个 商家 定制 ， 要 考虑 的 方面 有 环境 、 开 发 期 望 、 知 识 、 
DBA 经 验 、 生 产 工作 负载 、 服 务 水 平 协议 (SLA) 、 平 台 、DBMS 和 命名 约定 。 

建立 数据 库 变 更 实施 的 标准 化 表单 。 


标准 化 的 变更 请 求 表单 防止 了 在 变更 管理 过 程 可 能 出 现 的 沟通 不 畅 ， 因 此 ， 如 果 可 能 应 在 线 实 施 。 该 表单 应 包括 每 个 变更 的 
所 有 相关 信息 ， 至 少 要 包括 操作 系统 、 数 据 库 子 系统 或 实例 名 称 、 对 象 所 有 者 、 对 象 名 称 、 对 象 类 型 、 预 期 的 变更 以 及 要 求 的 日 
期 。 该 表单 还 包括 签字 框 ， 人 员 必 须 在 变更 上 签字 同意 后 才能 进行 实施 。 签 字 必 须 至 少 包括 应 用 程序 开发 团队 的 领导 者 和 一 名 高 
级 DBA， 但 根据 请 求 的 性 质 ， 也 可 包括 一 名 业务 单位 代表 、DA 或 SA。 


数据 库 变更 完成 后 ， 实 施 该 变更 的 DBA 应 在 表单 上 签字 然后 发 回 请 求 的 发 起 人 。 随 后 发 起 人 又 将 写 有 在 生产 环境 实施 该 变 
更 的 请 求 日 期 的 表单 返回 给 DBA。 


检查 清 


许多 DBA 制 定 了 用 于 跟踪 每 种 类 型 的 数据 库 变 更 的 清单 。 这 些 清单 可 能 集成 到 一 个 在 线 的 变更 请 求 系统 ， 以 便 DBA 可 以 根 
据 需 要 浏览 变更 。 此 外 ， 许 多 应 用 程序 开发 团队 使 用 清单 ， 确 保 了 应 用 程序 正常 运行 所 需 的 每 一 步 都 存在 并 经 过 了 验证 。 


DBA 团 队 和 应 用 程序 开发 团队 彼此 共享 各 自 的 清单 是 个 不 错 的 做 法 ， 这 样 可 以 验证 数据 库 变更 和 周转 过 程 中 的 每 一 步 是 否 
都 成 功 地 完成 。 DBA、 开 发 人 员 和 技术 支持 人 员 所 进行 的 工作 通常 会 有 重 熙 。 通 过 允许 各 团队 互相 检查 各 自 的 清单 ， 促 进 理 解 


其 他 人 在 变更 过 程 中 都 执行 了 哪些 步骤 。 许 多 步骤 需要 不 同 团队 间 进 行 复杂 的 相互 作用 和 沟通 。 正 式 的 审查 过 程 可 以 在 问题 出 现 
之 前 就 进行 纠正 。 


与 其 他 DBA 和 应 用 程序 开发 团队 共享 数据 库 变更 管理 清单 。 


7.3.6 沟通 
DBA 必 须 教会 开发 团队 如 何 请 求 数 据 库 的 变更 。 包 括 指导 他 们 访问 变更 请 求 表单 并 说 明 如 何 完成 表单 ， 并 向 他 们 提供 服务 
期 望 指南 。 


不 切实 际 的 服务 期 望 (往往 是 最 大 的 问题 ) 可 以 通过 培训 避免 。 例 如 ， 如 果 请 求 者 理解 DBA 团 队 执行 他 们 的 请 求 要 伦 上 两 
天 的 时 间 ， 他 们 也 就 能 将 这 种 延迟 考虑 进 他 们 的 时 间 表 。 在 企业 层面 澄清 实际 的 服务 期 望 ， 可 避免 DBA 被 诸如 “改变 这 一 
行 ”的 请 求 淹没 。 这 些 期 望 需 基于 可 靠 的 需求 ， 如 性 能 需求 、 可 用 性 、24/7 的 问题 等 。DBA 必 须 确保 在 所 有 请 求 者 随时 可 用 的 
政策 和 程序 中 包含 了 基于 可 靠 需 求 的 合理 时 间 框 架 。 只 有 这 样 变更 管理 才能 成 为 一 门 学 问 。 


不 切实 际 的 服务 期 望 可 以 通过 培训 避免 。 


7.3.7 ”协调 数据 库 和 应 用 程序 变 
尽管 本 章 主 要 关注 的 是 数据 库 结构 的 变更 ， 但 是 DBA 也 必须 参与 协调 程序 的 变更 。 通 常情 况 下 ， 新 的 程序 功能 会 对 数据 库 
变更 产生 影响 。 至 少 ， 新 的 列 需要 新 的 程序 逻辑 来 更 新 和 访问 。 


如 果 数 据 库 变更 在 程序 变更 之 前 就 制定 了 ， 新 的 数据 将 不 可 访问 ， 且 现 有 的 程序 也 可 能 会 失败 (如 果 结 构 变 更 与 程序 中 现 有 
的 结构 布局 不 兼容 ) 。 


如 果 程 序 变更 的 制定 早 于 数据 库 的 变更 ， 程 序 将 失败 ， 因 为 数据 库 结 构 与 期 望 的 结构 不 相符 。 


因此 ， 在 整个 DBA 团 队 和 应 用 程序 团队 协调 并 整合 从 测试 环境 到 生产 环境 的 周转 过 程 很 重要 。 变 更 应 一 同 制定 。 如 果 一 方 
的 变更 因为 任何 情况 需要 退回 ， 双 方 都 应 退回 。 不 这 么 做 将 会 导致 应 用 程序 和 数据 库 的 失败 。 


7.3.8 AKIE 
合 规 性 也 需要 集成 到 数据 库 变更 管理 实务 中 。 变 更 管理 的 方法 或 工具 集 必须 能 够 记录 所 有 变更 ， 以 便 跟踪 谁 以 及 何 时 对 哪些 
数据 进行 了 哪些 变更 。 能 够 证 明 每 一 个 变更 的 目的 是 合 规 性 的 重要 组 成 部 分 。 


尽管 法 规 通 常 不 会 影响 所 有 的 数据 库 数据 ， 但 只 跟踪 法 规 管辖 下 的 数据 库 结构 的 变更 也 难以 做 到 。 因 此 ， 明 智 的 做 法 是 跟踪 
并 记录 所 有 的 数据 库 变 更 以 确保 在 审计 时 的 依从 性 。 


一 些 数据 库 变 更 的 表单 需要 先 将 数据 印 载 然后 重新 加 载 。 所 有 适用 于 生产 环境 数据 的 法 规 本 身 也 适用 于 御 载 的 数据 。 请 务必 
妥善 保护 并 跟踪 数据 库 变 更 过 程 中 提取 、 御 载 、 归 档 或 备份 的 任何 数据 。 


实际 上 ， 合 规 性 还 引入 了 在 考虑 采用 数据 库 变更 管理 工具 时 另 一 个 令 人 信服 的 理由 。 使 用 变更 管理 工具 制定 一 个 程序 ， 然 后 
通过 使 用 该 工具 的 变更 审计 和 比较 功能 来 自动 跟踪 数据 库 的 所 有 结构 变更 。 捕 获 连 续 的 升级 /变更 之 间 所 做 的 变动 ， 并 向 审计 人 
员 提 供 何 时 进行 了 哪些 变更 的 记录 。 这 些 工具 还 增强 了 额外 的 安全 性 ， 确 保 数据 库 受 到 保护 以 防止 未 经 授权 的 变更 。 变 更 管理 工 
具 的 采用 还 有 助 于 变更 管理 策略 的 采用 ， 借 此 所 有 的 变更 (常规 的 、 非 常规 的 和 紧急 的 ) 都 使 用 变更 管理 工具 并 遵循 适当 的 程 
F, 具备 必要 的 日 志 级 别 和 严谨 性 。 


有 关 合 规 性 应 用 于 数据 库 管 理 的 更 完整 的 讨论 ， 请 见 第 15 章 。 


7.3.9 ”DBA 脚本 和 变更 管理 
对 于 DBA 来 说 ， 数 据 库 变更 管理 最 重要 的 方面 是 精心 策划 并 实施 数据 库 结构 的 变更 ， 而 不 会 对 数据 完整 性 和 可 用 性 产生 影 
响 。 但 是 ， 变 更 管理 也 有 DBA 必 须要 抗衡 的 其 他 方面 。 


DBA 制 定 并 使 用 的 许多 脚本 和 程序 也 应 满足 变更 管理 的 严谨 性 。 脚 本 和 程序 的 变更 与 生产 程序 变更 的 处 理 方式 大 致 相同 ， 
也 应 经 过 管理 、 批 准 、 测 试 和 推出 等 过 程 。 当 DBA 团 队 由 多 个 成 员 组 成 且 又 分 布 在 各 地 时 尤其 如 此 。 当 DBA 脚 本 需要 修改 时 ， 
代码 应 该 从 软件 变更 管理 库 签 出 。DBA 脚 本 通过 采用 一 种 程序 变更 控制 机 制 ， 可 以 消除 并 发 开发 项 目 中 的 一 些 内 在 问题 ， 如 双 
修改 或 重 写 变 更 。 


TA WS 


在 数据 库 的 整个 生命 进程 中 ， 肯 定 需要 进行 变更 。DBA 是 数据 库 的 监护 人 ， 因 此 负责 实施 变更 ， 以 负责 任 的 态度 确保 数据 
库 的 结构 、 完 整 性 和 可 靠 性 。DBA 必 须要 创建 并 管理 数据 库 变更 管理 的 准则 ， 该 准则 由 工具 、 程 序 和 策略 组 成 ， 以 适当 、 负 责 
任 地 影响 数据 库 的 变更 。 


7.5 ”回顾 


1.DBA 通 常 是 数据 库 变 更 的 发 起 人 ， 这 人 句 话 正 确 吗 ? 为 什么 ? 

2. 为 什么 向 现 有 表 的 两 个 现 有 列 中 间 添 加 列 很 困难 ? 

3. 在 不 断 变化 的 数据 库 环境 中 可 能 需要 对 三 种 类 型 的 数据 库 比 较 进行 命名 。 

4. 删 除数 据 库 会 产生 什么 影响 ? 

5. 如 果 你 所 在 的 企业 没有 使 用 数据 库 变 更 管理 工具 ， 请 描述 一 种 可 使 用 的 替代 变更 方法 。 
6. 请 解释 术语 “级 联 DROP” 。 


7. 为 什么 说 DBA 必 须要 了 解数 据 库 变更 和 那些 需要 使 用 变更 后 的 数据 的 应 用 程序 变更 之 间 的 关系 ? 


8. 你 所 在 的 企业 不 使 用 工具 来 实施 数据 库 对 象 的 变更 。 现 在 ， 你 需要 向 表 的 第 三 、 第 四 列 中 间 插 入 一 列 ， 该 表 原 有 十 列 。 请 
描述 你 进行 该 变更 的 准备 过 程 。 


9. 为 什么 DBA 会 希望 有 能 力 又 快 又 好 地 进行 两 个 数据 库 结构 的 比较 ? 


10. 如 果 你 不 得 不 删除 整 张 表 来 完成 某 个 数据 库 变 更 ， 有 什么 其 他 的 数据 库 结构 也 将 被 DBMS 自 动 删 除 ? 


7.6 ”推荐 书目 
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第 8 草 ”数据 可 用 性 


可 用 性 是 数据 库 管 理 员 的 圣杯 。 如 果 数 据 不 可 用 ， 应 用 程序 就 无 法 运行 。 如 果 应 用 程序 无 法 运行 ， 该 公司 就 会 失去 业务 。 
此 ，DBA 有 责任 尽 一 切 力量 确保 数据 库 正 常 运行 。 自 从 有 了 数据 库 ， 这 一 直 是 DBA 的 职责 。 


然而 ， 可 用 性 需求 一 直 都 在 增加 。 长 的 批 处 理 窗口 ， 其 中 数据 库 长 时 间 脱 机 执行 夜间 处 理 的 时 代 已 经 结束 了 。 电 子 商 务 促进 
了 持续 可 用 性 的 发 展 。 业 务 与 互联 网 耦合 已 经 极 大 地 改变 了 人 们 做 生意 的 方式 。 它 使 我 们 的 企业 有 希望 变 得 更 紧密 、 更 灵活 ， 更 
重要 的 是 ， 更 加 可 用 。 当 Web 与 数据 库 管理 整合 在 一 起 时 ， 大 家 都 期 望 DBA 能 够 保持 数据 库 运 行 更 顺畅 ， 运 行 时 间 更 长 。 如 果 
你 的 业务 是 在 线 的 ， 它 永远 不 会 打 料 。 人 们 期 望 它 无 论 何 时 都 可 以 访问 Web 站 点 上 的 全 部 功能 。 请 记 住 ， 网 络 是 世界 性 的 。 纽 
约 的 早上 三 点 钟 ， 可 能 是 世界 上 某 个 地 方 的 黄金 时 间 。 因 此 ， 电 子 商 务必 须 可 用 ， 每 天 24 小 时 运营 ,每 周 7 天 ,一 年 365 天 (E 
年 为 366) 。 如 果 你 的 客户 在 纽约 早上 三 点 钟 开展 业务 ， 你 最 好 也 开始 ， 否 则 可 能 会 失去 该 客户 的 业务 。 


可 能 是 世界 上 某 个 地 方 的 黄金 时 间 。 


在 Web 上 ， 你 的 竞争 对 手 都 只 是 一 次 简单 的 鼠标 点 击 的 距离 。 研 究 表明 ， 如 果 网 络 客户 在 几 秒 钟 内 没有 得 到 他 们 想 要 的 服 
务 ， 他 们 将 转移 到 其 他 地 方 的 业务 。Jupiter Research 的 调查 发 现 ，339% 的 宽带 消费 者 加 载 一 个 网 页 等 待 的 时 间 不 会 超过 4 秒 。 
Amazon 所 进行 的 测试 显示 ， 加 载 时 间 每 增加 100ms，Amazon.com 的 销售 额 就 下 降 1%。 


如 果 你 的 潜在 客户 在 你 的 竞争 对 手 处 得 到 满足 ， 他 们 可 能 就 永远 不 会 再 回来 了 。 所 以 ， 如 果 一 个 电子 商务 网 站 在 很 短 的 时 间 
内 不 能 使 用 ， 那 么 不 仅 可 能 会 导致 失去 数 自 或 数 干 次 点 击 率 ， 同 时 也 会 失去 业务 。 停 机 的 影响 ， 不 能 以 直接 损失 的 业务 作为 测 
量 。 电 子 商 务 停机 时 间 也 会 损害 企业 的 信誉 和 公众 形象 。 这 些 东 西 一 旦 丢失 ， 重 建 将 会 非常 困难 。 


事实 上 ， 一 些 学 者 使 用 “Internet 时 间 ” 来 形容 与 互联 网 项 目 相关 的 快速 变化 和 快速 开发 时 间 表 ， 但 DBA 认 为 Internet 时 间 
只 是 一 个 简单 的 布尔 方程 ， 正 常 运行 时 间 和 停机 时 间 。 在 正常 运行 时 间 进 行业 务 和 客户 服务 ; 停机 时 间 ， 业 务 暂停 且 不 为 客户 提 
供 服务 。 因 此 ， 互 联网 时 代 的 DBA 都 严格 专注 于 保持 可 用 性 。 


当然 ， 电 子 商 务 不 是 唯一 提高 可 用 性 的 驱动 器 。 其 他 因素 包括 : 
电子 商务 不 是 唯一 提高 可 用 性 的 驱动 器 。 


. 快餐 客户 要 求 良 好 的 服务 ， 并 要 求 服务 的 速度 及 时 。 


* 在 客户 选择 时 提供 更 优质 的 服务 ， 期 望 在 市 场 上 获得 竞争 优势 。 


* 回击 竞争 对 手 的 需求 : 因为 竞争 对 手 的 数据 具有 较 高 的 可 用 性 ， 他 们 向 客户 提供 了 更 好 的 服务 。 


8.1 定义 可 用 性 


在 进一步 讨论 可 用 性 的 重要 性 之 前 ， 有 必要 先 了 解 可 用 性 的 定义 。 毕 竟 ， 我 们 应 该 知道 在 谈论 什么 。 简 单 地 说 ， 可 用 性 是 消 
费 者 可 以 访问 一 个 给 定 资源 的 状态 。 这 意味 着 ， 如 果 数 据 库 是 可 用 的 ， 那 么 其 数据 的 用 户 (应 用 程序 客户 和 商业 用 户 ) 可 以 访问 
它 。 任 何 使 资源 无 法 访问 的 条 件 都 会 导致 相反 的 情况 : 不 可 用 。 


可 用 性 是 消费 者 可 以 访问 一 个 给 定 资 源 的 状态 。 


另 一 个 可 用 性 定义 是 系统 可 用 于 生产 工作 的 时 间 百 分 比 。 一 个 应 用 程序 所 需 的 可 用 性 因 企业 的 不 同 而 不 同 ， 而 同 在 一 个 企业 
因 系统 的 不 同 而 不 同 ， 甚 至 因 用 户 的 不 同 而 不 同 。 


at 


数据 库 可 用 性 和 数据 库 性 能 是 容易 彼此 混淆 的 概念 ， 事 实 上 ， 这 两 者 之 间 有 相似 之 处 。 主 要 的 区 别 在 于 用 户 访问 数据 库 的 能 
力 。 访 问 数据 库 的 性 能 可 能 不 佳 ， 但 不 可 能 访问 不 可 用 的 数据 库 。 所 以 ， 性 能 不 佳 什么 时 候 会 变 成 不 可 用 ”如 果 性 能 受到 很 大 程 
度 的 影响 以 至 于 数据 库 用 户 无 法 执行 他 们 的 工作 ， 数 据 库 已 经 变 得 (不 管 是 何 意图 和 目的 ) 不 可 用 。 尽 管 如 此 ， 请 记 住 ， 可 用 性 
和 性 能 是 不 同 的 ， 必 须 由 DBA 区 别 对 待 ， 尽 管 严重 的 性 能 问题 可 能 会 导致 可 用 性 问题 。 


可 用 性 和 性 能 是 不 同 的 ， 必 须 由 DBA 区 别 对 待 。 

可 用 性 包括 四 个 不 同 的 组 成 部 分 ， 它 们 一 起 保证 系统 的 运行 和 业务 的 进行 : 
可 用 性 包括 可 管理 性 、 可 恢复 性 、 可 人 靠 性 和 可 维护 性 。 

. 可 管理 性 : 创建 和 维护 一 个 有 效 的 环境 ， 为 用 户 提供 服务 的 能 力 。 

. 可 恢复 性 : 在 发 生 错 误 或 组 件 故障 时 ， 能 够 重建 服务 的 能 力 。 

.可靠 性 : 在 既定 时 间 内 提供 规定 水 平 的 服务 的 能 力 。 


* 可 维护 性 : 确定 问题 的 存在 ， 诊断 出 原因 并 修复 问题 的 能 力 。 


所 有 这 四 种 “能 力 ”影响 着 系统 、 数 据 库 或 应 用 程序 的 整体 可 用 性 。 


增加 的 可 用 性 需求 


如 今 在 任何 大 型 公司 谈 到 DBA 组 ， 你 都 会 听 到 控制 状态 的 混乱 气氛 。DBA 都 在 争先 丽 后 地 解决 各 种 需求 ， 包 括 设计 新 的 应 
用 程序 保持 业务 (关键 应 用 程序 的 运作 ) 。 同 时 ， 企 业 高 管 要 求 DBA 完 成 这 些 任 务 且 很 少 或 没有 停机 时 间 。 随 着 越 来 越 多 的 企 
业 需 要 全 时 的 系统 可 用 性 ， 以 及 停机 时 间 成 本 的 增加 ， 优 化 关键 业务 系统 和 软件 性 能 的 可 用 时 间 一 直 在 缩短 。 


优化 关键 业务 系统 和 软件 性 能 的 可 用 时 间 一 直 在 缩短 。 


另 一 方面 ， 如 果 忽 略 了 日 常 维护 程序 ， 性 能 也 会 受到 影响 。DBA 被 迫 在 24/7 可 用 性 和 延迟 系统 维护 的 后 果 之 间 执 行 微 妙 的 
平衡 。 赌 注 很 高 ， 而 且 IT 困 在 了 这 看 似 矛 盾 的 目标 中 。 


缩小 的 维护 窗口 


所 有 成 长 中 的 企业 都 积累 了 大 量 的 数据 。 企 业 数据 库 不 断 扩大 ， 规 模 和 复杂 性 也 在 不 断 增加 。TB 级 数据 库 是 常见 的 ， 最 大 
的 生产 数据 库 超过 了 PB 级 。 同 时 ，24/7 系 统 可 用 性 更 多 的 是 需求 而 不 是 例外 。DBA 想 要 找 时 间 执 行 日 常 系统 维护 越 来 越 难 。 高 
事务 量 的 数据 库 需要 定期 维护 和 重组 。 由 于 经 常 使 用 ， 数 据 库 变 得 支离破碎 ， 数 据 路 径 变 得 效率 低下 ， 性 能 也 在 下 降 。 必 须 将 数 
据 放 回 一 个 有 序 的 序列 中 ， 擦 除 删除 操作 所 造成 的 空 阶 。 此 外 ， 进 行 碎片 整理 和 重组 通常 会 导致 数据 库 停机 。 


DBA 想 要 找 时 间 执 行 日 常 系 统 维 护 越 来 越 难 。 
决策 支持 、 商 业 智能 和 分 析 


越 来 越 多 的 公司 正在 为 决策 支持 寻找 新 的 方法 来 使 用 核心 业务 数据 。 例 如 ， 信 用 卡 公司 列 出 采购 及 每 月 编制 报表 的 信息 。 可 
以 使 用 相同 的 信息 来 分 析 消 费 者 的 消费 模式 并 针对 特定 人 群 和 个 人 消费 者 设计 促销 活动 。 这 意味 着 ， 核 心 业务 数据 必须 跨 多 个 数 
据 库 环境 复制 ， 并 提供 用 户 友好 的 格式 。 因 此 ， 可 操作 数据 的 可 用 性 会 受到 决策 支持 用 户 需 求 的 负面 影响 ， 因 为 在 批量 数据 御 载 
处 理 过 程 中 大 量 的 数据 不 能 更 新 。 


商业 智能 (BI) 应 用 程序 通过 数据 分 析 支 持 更 好 的 业务 决策 。BI 技 术 可 以 为 业务 运营 提供 历史 、 当 前 和 预测 观点 。BI 系 统 和 
决策 支持 系统 (DSS) 有 点 像 同 义 词 。 商 业 智能 技术 的 常见 功能 是 报告 、 在 线 分 析 处 理 、 分 析 、 数 据 挖 掘 、 过 程 挖掘 、 复 杂事 件 
处 理 、 业 务 性 能 管理 、 标 杆 管理 、 文 本 挖掘 和 预测 分 析 。 

但 是 ， 目 前 这 个 领域 的 流行 语 是 先进 的 分 析 ， 这 意味 着 以 业务 为 中 心 的 方法 (包括 技术 ) 有 助 于 建立 模型 和 模拟 创设 情景 ， 
以 及 了 解 现实 和 未 来 的 状态 。 为 了 让 企业 提高 业务 性 能 ， 高 级 分 析 使 用 数据 挖掘、 预测 分 析 、 应 用 程序 分 析 、 统 计 和 其 他 方法 。 

举例 : 分 析 的 优点 

一 家 大 型 的 无 线 电话 服务 提供 商 非 常 关心 失去 的 客户 数量 。 每 失去 一 个 客户 ， 公 司 的 月 收入 就 减少 53 美 元 。 虽 然 从 单个 客户 
来 看 收入 损失 比较 小 ， 但 公司 有 庞大 的 客户 群 ， 公 司 每 月 的 损失 高 达 百 万 美元 。 使 用 先进 的 分 析 方法 ， 能 够 开发 出 损耗 模型 来 预 
测 哪些 客户 最 有 可 能 终止 其 合同 。 同 时 ， 该 公司 又 开发 出 一 个 模型 用 于 交叉 销售 ， 通 过 提供 产品 、 服 务 和 其 他 针对 个 人 资料 的 激 
励 措施 ， 帮 助 留 住 客 户 。 这 项 计划 提高 了 保留 率 ， 并 帮助 公司 节省 了 670 万 美元 。 


这 是 一 则 成 功 的 案例 ， 在 那些 通过 部 署 先进 的 分 析 方法 来 更 好 地 了 解数 据 的 公司 比较 常见 。 


传统 的 商业 智能 使 我 们 能 够 了 解 给 定 业 务 的 当前 情况 ， 甚 至 在 某 种 程度 上 还 可 以 了 解 原因 。 高 级 分 析 可 以 更 加 深入 地 分 析 业 


务 情况 ， 并 提供 可 能 的 结果 (参阅 “举例 : 分 析 的 优点 ”) 。 虽 然 先进 的 分 析 不 能 准确 无 误 地 预测 未 来 ， 但 它 可 以 提供 模型 ， 来 
判断 事件 的 可 能 性 。 通 过 让 企业 管理 者 意识 到 可 能 的 结果 ， 了 解 他 们 的 决策 在 不 久 的 将 来 的 效果 ， 先 进 的 分 析 可 以 帮助 改善 业务 
决策 。 


虽然 先进 的 分 析 不 能 准确 无 误 地 预测 未 来 ， 但 它 可 以 提供 模型 ， 来 判断 事件 的 可 能 性 。 


先进 的 分 析 能 力 可 以 用 来 推动 广泛 的 应 用 ， 从 业务 应 用 (如 欺诈 检测 ) 到 战略 分 析 (如 客户 细 分 ) 。 无 论 哪 种 应 用 ， 先 进 的 
分 析 以 预测 、 描 述 、 分 数 和 简介 的 形式 提供 智能 ， 帮 助 企业 更 好 地 了 解 客 户 行 为 和 业务 趋势 。 决 策 支 持 、 商 业 智能 和 高 级 分 析 都 
依赖 访问 数据 ， 大 量 的 数据 。 


数据 仓库 


正如 决策 支持 、 商 业 智 能 和 高 级 分 析 扩 大 了 运营 数据 的 使 用 ， 数 据 仓库 推动 了 数据 库 的 整体 增长 。 典 型 的 数据 仓库 需要 复制 
特定 部 门 或 业务 单位 的 数据 。 将 外 部 数据 卸载 和 加 载 到 操作 数据 存储 ， 然 后 到 数据 仓库 和 数据 集 市 ， 增 加 了 运行 和 管理 数据 库 实 
用 程序 操作 的 数量 。 传 播 数据 花费 的 时 间 反 而 影响 了 数据 源 和 数据 目标 双方 在 外 载 和 加 载 处 理 方面 的 整体 可 用 性 。 由 于 知识 工作 
者 的 信息 需求 ， 高 级 分 析 拓 展业 务 和 存储 介质 成 本 的 下 降 ， 数 据 仓库 的 增长 在 可 预见 的 未 来 将 继续 不 受 约束 。 


数据 仓库 的 增长 在 可 预见 的 未 来 将 继续 不 受 约束 。 
全 时 可 用 性 


就 在 最 新 的 硬件 和 软件 技术 使 24/7 可 用 性 变 成 可 能 的 同时 ， 全 球 经 济 的 命令 迫使 iT 部 门 对 新 的 形势 重新 进行 评估 。 现 在 的 流 
行 语 是 24/24 可 用 性 ， 因 为 业务 遍布 所 有 时 区 ， 数 据 对 新 时 区 的 用 户 也 必须 可 用 ， 操 作 DBMS 的 人 并 不 都 来 自 同一 时 区 。 

机 票 预订 系统 、 信 用 卡 审批 功能 、 电 话 公司 的 应 用 程序 都 必须 全 天 地 运行 。 国 际 金融 是 需要 全 时 可 用 性 的 最 佳 范例 之 一 。 金 
钱 永 不 眠 ， 每 天 欧元 、 美 元 、 英 镑 和 人 民 币 都 会 有 流动 。 基 于 代理 买卖 决策 的 全 球 信息 交流 也 是 如 此 。 大 量 的 金钱 每 分 钟 都 可 能 
会 有 危险 ， 根 本 就 不 允许 出 现 停机 时 间 。DBA 和 IT 专业 人 士 需要 将 以 前 维护 、 备 份 和 恢复 的 时 间 都 花 在 这 些 细小 功能 上 。 


日 益 增加 的 IT 复杂 性 


任何 单个 供应 商 的 系统 都 应 该 是 干净 、 明 确 和 可 预见 的 。 但 今天 ， 很 难 找到 任何 规模 的 公司 不 在 异 构 环 境 中 工作 ， 包 括 大 型 
机 、 中 型 机 、 客 户 端 / 服 务 器 基础 设施 中 的 桌面 系统 。 随 着 这 些 系统 规模 和 功能 的 扩大 ，I!T 人 员 必 须 想 办 法 调整 复杂 的 异 构 IT 环 
境 来 适应 业务 需求 。 这 是 硬件 制造 商 描绘 的 理想 情况 。 此 外 ， 由 于 DBMS 新 的 版 本 和 功能 以 极 快 的 速度 发 布 ， 其 本 身 也 可 能 会 增 
加 复杂 性 。 


很 难 找到 任何 规模 的 公司 不 在 异 构 环 境 中 工作 。 


复杂 性 也 源 于 人 为 因素 。 裁 员 迫 使 以 前 的 上 T 专 家 成 为 多 面 手 。 其 结果 是 ， 一 些 任务 ， 如 数据 库 重 组 (以 前 对 于 DBA 专 家 有 时 
是 非常 简单 的 任务 ) ， 对 于 多 面 手 非常 复杂 且 要 花 很 长 一 段 时 间 来 完成 。 当 然 ， 他 也 不 能 在 企业 减员 中 幸免 ， 现 在 处 理 日 常 计 算 
机 问题 的 人 员 比 前 几 年 更 少 了 。 最 后 ， 兼 并 和 收购 迫使 和 人 员 整 合 不 兼容 的 系统 和 数据 结构 。 


8.2 ”停机 成 本 


停机 成 本 因 公司 而 异 。 应 急 计 划 和 研究 (Edge Rock Alliance 有 限 公司 的 分 支 ) 估算 零售 经 纪行 业 每 小 时 约 为 6500000 美 


元 。 请 参考 表 8-1 估 算 行业 每 小 时 的 停机 成 本 的 其 他 例子 。 当 然 ， 这 些 数 字 都 是 近似 值 ， 每 个 企业 都 需要 基于 客户 、 系 统 和 业务 
运营 确定 其 停机 的 实际 成 本 。 


表 8-1 停机 成 本 


业务 类 型 中 断 的 每 小 时 财政 影响 
零售 经 纪行 业 6 450 000 美元 
信用 卡 销售 授权 2 600 000 美元 
家 庭 销售 频道 113 750 美元 
目录 销售 中 心 90 000 美元 
航空 服务 中 心 89 500 美元 
fi) BE HE NS 28250 美元 
ATM 服务 收费 14 500 美元 


一 些 企业 可 以 更 好 地 处 理 停机 。 对 于 券商 ， 停 机 是 一 场 灾 难 。 对 于 在 中 断 期 间 可 以 使 用 手动 系统 “暂时 维持 ”的 其 他 企业 ， 
停机 不 是 太 大 的 灾难 。 事 实 上 ， 中 断 会 影响 每 一 个 企业 ， 任 何 停机 都 会 对 企业 的 成 本 产生 影响 。 佑 算 停机 成 本 时 ， 切 记 要 考虑 所 
有 费用 ， 包 括 


在 中 断 期 间 失 去 的 业务 。 

“ 系统 恢复 以 后 ， 赶 工 的 成 本 。 

- 任何 诉讼 的 法 律 费用 。 

` 股票 缩水 的 影响 (特别 是 依靠 其 业务 的 所 有 计算 机 系统 的 网 络 公司 ) 。 


此 外 ， 停 机 时 间 会 对 公司 的 形象 造成 负面 影响 。 在 这 个 时 代 ， 任 何 长 时 间 的 中 断 都 会 对 业务 产生 影响 ， 特 别 是 电子 商务 ， 会 
被 媒体 曝光 ， 如 果 事 情 很 重大 ， 可 能 不 只 出 现在 计算 机 新 闻 中 ， 还 会 出 现在 商业 新 闻 中。 我 们 要 勇敢 面 对 ， 因 为 往往 坏 消息 的 传 
播 速度 都 很 快 。 但 要 想 重建 公司 的 形象 ， 可 能 就 会 比较 困难 。 


有 时， 公司 不 愿意 把 钱 花 在 软件 和 服务 上 提高 可 用 性 ， 因 为 他 们 不 了 解 业务 停机 的 真实 成 本 。 一 种 思路 是 这 样 的 : “我 知道 
我 们 的 系统 可 能 会 中 断 ， 但 它 对 我 们 的 影响 非常 小 ， 所 以 我 们 为 什么 要 支付 任何 费用 来 阻止 中 断 ? ”然而 ， 当 认识 和 了 解 到 停机 
的 所 有 成 本 和 风险 因素 后 ， 这 样 的 思想 就 会 改变 。 


没有 预算 停机 成 本 将 很 难 从 成 本 上 证 明 DBA 需 要 采取 措施 确保 数据 的 可 用 性 。 


多 高 的 可 用 性 才 足 够 


传统 上 可 用 性 是 根据 一 项 服务 占用 总 时 间 的 百分比 进行 讨论 的 。 例 如 ， 一 个 99% 可 用 的 系统 ， 启 动 和 运行 占用 了 99% 的 时 
间 ， 停 机 时 间或 不 可 用 的 时 间 应 为 1%。 用 于 定义 可 用 性 的 另 一 个 术语 是 MTBF ， 或 平均 故障 间隔 时 间 。 更 准确 地 说 ，MTBF 更 好 
地 描述 了 可 靠 性 而 不 是 可 用 性 。 然 而 ， 可 靠 性 对 可 用 性 有 一 定 的 影响 。 一 般 情况 下 ， 系 统 越 可 靠 ， 可 用 性 就 越 高 。 


互联 网 时 代 的 趋势 是 提供 永 无 休止 的 运行 时 间 。 


那么 ， 到 底 多 高 的 可 用 性 才 足 够 ”互联 网 时 代 的 趋势 是 提供 永 无 休止 的 运行 时 间 ， 一 年 365 天 ， 一 天 24 小 时 。 一 个 小 时 60 分 
钟 ， 这 意味 着 一 年 正常 运行 时 间 是 525600 分 钟 。 显 然 ， 要 实现 100% 的 可 用 性 只 能 是 一 个 值得 称赞 的 目标 。 术 语 五 个 九 经 常用 来 
描述 一 个 高 可 用 性 系统 。 即 99.999% 的 正常 运行 时 间 ， 五 个 九 说 明 本 质 上 是 100% 的 可 用 性 ， 同 时 也 可 能 会 有 极 短 时 间 的 停机 


( 见 表 8-2) o 
表 8-2 可 用 性 与 停机 时 间 


m 每 年 大 约 的 停机 时 间 
O 按 分钟 计 按 小 时 计 
| 分钟 ae 0.08 小 时 
| 分钟 0.88 小 时 
| 1052 分 钟 17.5 小 时 
38 
| 5256 分 名 87.6 小 时 
175.2 小 时 (或 7.3 K) 


尽管 100% 的 可 用 性 不 太 合 理 ， 但 一 些 系统 的 可 用 性 接近 五 个 九 。DBA 可 以 采取 措施 设计 数据 库 ， 并 建立 系统 来 实现 高 可 用 
性 。 然 而 ， 可 以 构建 高 可 用 性 的 系统 并 不 意味 着 每 个 系统 都 应 该 要 有 高 可 用 性 的 设计 。 因 为 高 度 可 用 性 的 系统 比 传统 系统 的 成 本 
高 很 多 倍 。DBA 需 要 与 终端 用 户 协商 并 清楚 说 明 高 度 可 用 系统 的 相关 成 本 。 


高 可 用 性 对 每 个 新 的 系统 、 数 据 库 或 应 用 程序 都 是 一 个 目标 ， 需 要 仔细 分 析 确 定 用 户 可 以 容忍 的 停机 时 间 ， 中 断 将 产生 什么 
样 的 影响 。 高 可 用 性 是 一 个 诱 人 的 需求 ， 终 端 用 户 通常 会 请 求 尽 可 能 高 的 可 用 性 。 作 为 一 名 DBA， 你 需要 调查 这 些 需求 是 否 现 


实 
高 可 用 性 是 一 个 诱 人 的 需求 ,但 你 需要 调查 这 些 需求 是 否 现实 。 


数据 库 环境 的 可 用 性 将 根据 成 本 而 定 。 应 用 程序 所 有 者 可 以 支付 多 高 的 可 用 性 ? 这 是 最 终 的 问题 。 虽 然 有 可 能 实现 高 可 用 
性 ,但 鉴于 应 用 程序 的 性 质 以 及 支持 它 的 可 用 预算 ， 高 可 用 性 可 能 不 符合 成 本 效益 。DBA 需 要 积极 主动 地 与 应 用 程序 所 有 者 沟 
通 ， 确 保 应 用 程序 所 有 者 充分 理解 可 用 性 的 成 本 。 


8.3 可 用 性 问题 


由 于 这 本 书 的 重点 是 数据 库 管 理 ， 假 设 DBA 必 须 管理 受 其 控制 的 数据 库 的 可 用 性 。 尽 管 如 此 ， 有 关 DBA 在 可 用 性 方面 的 职 
责 定义 并 不 完整 。 为 了 进一步 理解 其 中 的 原因 ， 先 来 看 一 些 导致 数据 不 可 用 的 潜在 原因 。 


8.3.1 数据 中 心 的 丢失 

很 明显 ， 如 果 数 据 中心 由 于 自然 灾害 或 一 些 其 他 类 型 的 灾难 丢失 ， 数 据 将 不 可 用 。 从 商业 的 角度 来 看 ， 无 论 多 小 的 灾难 都 会 
影响 业务 的 计算 资源 ， 而 重大 灾难 则 会 影响 整 栋 楼 或 整个 企业 ， 失 去 了 计算 机 就 意味 着 失去 数据 库 以 及 其 中 的 任何 数据 。 

出 现 灾难 情 时 要 恢复 可 用 性 ， 通 常 需要 重新 远程 创建 数据 库 环 境 (也 许 更 多 ) 。 第 17 章 中 详细 介绍 了 如 何 应 对 这 种 情况 。 


从 可 用 性 的 角度 来 看 ， 失 去 数据 中 心 是 DBA 遇 到 的 最 严重 的 可 用 性 问题 。 即 使 数据 和 数据 库 在 远程 位 置 已 经 恢复 ， 严 重 的 
可 用 性 问题 仍然 挥 之 不 去 。 例 如 ， 可 能 所 有 的 数据 都 已 经 过 期 ， 这 需要 DBA 和 用 户 先 重建 数据 才能 进行 一 般 的 数据 库 访 问 。 此 


外 ， 确 保 用 户 正确 连接 到 新 的 位 置 也 可 能 会 增加 中 断 时 间 ， 因 为 从 未 遇 到 过 的 设置 问题 可 能 会 导致 后 续 的 中 断 。 灾 害 规 划 和 制定 
一 套 良 好 的 灾难 应 对 计划 将 最 大 限度 地 减少 此 类 问题 。 


失去 数据 中 心 是 DBA 遇 到 的 最 严重 的 可 用 性 问题 。 


8.3.2 ”网 络 问题 


如 果 数 据 库 服务 器 在 单个 网 络 交换 机 上 ， 该 交换 机 发 生 了 中 断 ， 数 据 库 就 会 不 可 用 。 考 虑 实施 隐 余 的 网 络 交换 机 ， 以 防止 此 
类 中 断 。 

网 络 访问 丢失 也 可 能 会 导致 数据 库 中 断 。 这 样 的 问题 通常 是 由 硬件 故障 (如 数据 库 服 务 器 的 网 卡 ) 造成 的 。 明 智 的 做 法 是 出 
现 这 样 的 问题 立即 更 换 备 用 硬件 ， 如 果 有 可 用 的 备用 网 络 硬件 。 

然而 ， 并 非 所 有 的 网 络 问题 都 因为 硬件 有 问题 。 安 装 一 个 新 版 本 的 网 络 软件 或 指定 不 准确 的 网 络 地 址 ， 都 可 能 会 导致 数据 库 
中 断 。DBA 不 是 网 络 专家 ， 不 能 期 望 他 解决 所 有 类 型 的 网 络 问题 ， 但 是 ， 当 某 个 问题 是 由 网 络 造成 的 ， 而 不 是 DBMS、 应 用 程序 
或 数据 库 应 用 程序 所 使 用 的 一 些 其 他 硬件 或 软件 时 ，DBA 应 该 能 够 识别 这 一 问题 。 


DBA 应 该 与 企业 的 网 络 专家 建立 良好 的 工作 关系 。 当 网 络 出 现 问题 时 ，DBA 可 以 马上 向 网 络 专家 咨询 ， 并 从 与 他 们 的 合作 
中 学 到 一 些 东 西 。 


8.3.3 ”服务 器 硬件 的 丢失 


基本 上 ， 数 据 库 服务 器 硬件 由 CPU、 内 存 、 磁 盘子 系统 的 数据 库 组 成 。 下 面 介绍 丢失 任何 一 种 或 所 有 这 些 组 件 将 会 对 数据 
库 的 可 用 性 产生 的 影响 。 


显然 ， 如 果 CPU 损 坏 或 因 任何 原因 变 得 不 可 用 ， 该 数据 库 也 因此 无 法 使 用 。 即 使 数据 库 服 务 器 只 丢失 了 CPU， 即 使 系统 内 
存 和 磁盘 子 系统 保持 不 变 ， 数 据 库 仍然 无 法 访问 ， 因 为 CPU 驱动 所 有 的 计算 机 进程 。 然 而 ， 数 据 库 文 件 应 该 保持 可 用 ， 并 可 能 
连接 到 另 一 个 CPU 使 数据 库 重 新 运行 。 


为 了 避免 CPU 故障 引起 的 中 断 ， 可 以 考虑 使 用 硬件 集群 故障 转移 技术 。 使 用 集群 故障 转移 时 ， 一 台 服 务 器 的 丢失 将 使 系统 
在 集群 系统 的 男 一 个 节点 上 处 理 。 不 需要 移动 数据 ， 故 障 会 自动 转移 。 


另 一 种 方法 是 使 用 备用 系统 : 主 服务 器 上 的 数据 库 日 志 副 本 转移 到 辅助 服务 器 上 ， 或 主 服务 器 上 的 数据 复制 到 辅助 服务 器 
上 。 另 一 种 方法 是 保持 第 二 个 服务 器 与 主 服务 器 配置 相同 ， 这 样 只 需 从 主 服务 器 中 拉 出 驱动 器 ， 并 将 其 插入 辅助 服务 器 中 即 可 。 


任何 这 样 的 快速 故障 转移 方法 都 取决 于 你 使 用 的 硬件 的 类 型 、 该 硬件 参与 某 些 故 障 转 移 技术 的 能 力 ， 以 及 该 技术 相关 的 成 
本 。 参 阅 “Oracle 备 用 数据 库 选项 ”来 了 解 其 中 一 种 数据 库 故障 转移 的 方法 。 [1] 


如 果 系 统 内 存 出 现 故 障 ， 数 据 库 可 能 可 用 也 可 能 不 可 用 。 如 果 所 有 的 系统 内 存 都 出 现 故 障 ， 系 统 中 的 任何 数据 库 都 将 不 可 
用 ， 因 为 内 存 是 关系 数据 库 系统 操作 所 必需 的 。 要 解决 这 种 情况 ， 你 需要 更 换 有 故障 的 内 存世 片 或 模块 。 但 是 ， 只 有 部 分 系统 内 
存 出 现 故 障 时 ， 数 据 库 可 能 仍然 可 用 ， 虽 然 性 能 可 能 会 受到 影响 。 同 样 地 ， 更 换 出 现 故 障 的 内 存 组 件 ， 应 该 可 以 解决 问题 。 


如 果 整 个 数据 库 服 务 器 丢失 或 损坏 ， 解 决 起 来 会 比较 困难 。 丢 失 整 个 服务 器 意味 着 CPU、 内 存 和 磁盘 子 系统 都 不 可 用 。 同 


样 地 ， 在 这 种 情况 下 ， 服 务 器 上 的 数据 库 也 将 无 法 使 用 。 如 果 整 个 服务 器 平台 出 现 故 障 ， 数 据 库 将 需要 重建 。 假 设 磁盘 上 的 数据 
可 以 访问 或 是 有 效 的 ， 即 使 它 可 以 访问 ， 也 是 不 安全 的 。 整 个 数据 库 系 统 ， 包 括 配 置 、 连 接 和 数据 ， 都 需要 重建 。 数 据 将 与 最 新 
的 数据 库 日 志 一 样 ， 变 得 准确 和 最 新 。 数 据 库 文件 需要 根据 备份 副本 和 重新 应 用 的 数据 库 日 志 变 更 进行 恢复 。 有 关 数 据 库 备 份 和 
恢复 的 更 多 信息 ， 请 参阅 第 16 章 。 


Oracle 备 用 数据 库 选项 


Oracle 支 持 创 建 备 用 数据 库 的 能 力 。 备 用 数据 库 是 正在 运行 的 数据 库 的 副本 ， 在 原来 的 数据 库 发 生 中 断 时 ， 可 以 使 用 该 备用 
数据 库 。 通 常情 况 下 ， 原 始 数据 库 称 为 主 数 据 库 或 源 数据 库 ， 备 用 数据 库 称 为 次 数据 库 或 目标 数据 库 。 


它 的 工作 原理 是 这 样 的 : 将 应 用 到 主 数据 库 的 事务 ， 使 用 主 数据 库 的 重 做 日 志 应 用 到 备用 数据 库 。 当 Ortacle 归 档 重 做 日 志 
时 ， 就 会 将 归档 的 日 志 发 送 到 备用 数据 库 服务 器 并 应 用 。 因 此 ， 备 用 数据 库 的 版 本 永远 比 主 数据 库 版 本 老 一 些 。 


如 果 主 数据 库 发 生 中 断 ，DBA 可 以 切换 到 备用 数据 库 。 这 是 通过 备用 数据 库 的 恢复 模式 ， 申 请 所 有 的 归档 重 做 日 志 ， 然 后 
(如 果 可 能 ) 根据 当前 的 重 做 日 志 应 用 事务 ， 将 备用 数据 库 切 换 为 主 数据 库 。 当 原来 的 主 数据 库 修 复 时 ， 会 作为 新 的 备用 数据 
库 。 

需要 用 到 不 同 程度 的 可 用 性 时 ，Oracle 还 支持 备用 实例 和 备用 表 。 当 然 ， 实 施 备 用 数据 库 之 前 ，Oracle DBA 需 要 了 解 更 多 的 
实施 细节 。 这 些 具 体 实施 细节 超出 了 本 书 的 讨论 范围 ， 读 者 可 以 直接 从 Oracle 的 产品 文档 中 了 解 。 


但 是 ， 请 记 住 ， 实 施 备用 数据 库 并 不 意味 着 就 不 需要 制作 主 数据 库 或 次 数据 库 的 备份 副本 了 。 不 管 怎 样 ， 在 发 生 非 计划 性 中 
断 时 ， 备 用 Oracle 数 据 库 可 以 帮助 提高 可 用 性 。 


如 果 采 取 预 防 措施 ， 就 不 太 可 能 失去 整个 数据 库 服 务 器 ， 当 然 ， 只 凭借 购买 一 个 可 靠 的 服务 器 ， 而 不 考虑 停机 时 间 是 完全 不 
行 的 。 无 论 内 置 的 耐用 性 和 可 用 性 功能 如 何 ， 硬 件 都 会 变 坏 。 用 电 高 峰 、 停 电 、 人 为 错误 等 都 可 能 导致 严重 的 故障 。DBA 应 该 
始终 确保 元 余 电源 和 不 间断 电源 (UPS) 系统 保护 数据 库 服务 器 ， 防 止 突然 停电 的 损失 并 采取 适当 的 预防 措施 ， 这 样 服务 器 硬件 
故障 产生 的 任何 类 型 的 中 断 的 概率 都 会 降 到 最 低 。 


如 果 采 取 预 防 措施 ， 就 不 太 可 能 失去 整个 数据 库 服务 器 。 


[1] Availability Groups in SQL Server 2012 offer a similar failover technology. 


8.3.4 ”磁盘 相关 的 中 断 


由 于 数据 库 依赖 物理 磁盘 结构 来 实际 存储 数据 ， 数 据 库 的 可 用 性 特别 容易 受到 磁盘 故障 的 影响 。 当 然 ， 数 据 库 不 可 用 的 程度 
取决 于 磁盘 系统 的 类 型 和 磁盘 系统 发 生 的 中 断 的 类 型 。 磁 盘 驱 动 器 出 现 故 障 的 原因 有 很 多 : 物理 驱动 机 制 出 现 故障 ， 控 制 器 出 现 
故障 ， 或 者 连接 线 松 动 。 


数据 库 可 用 性 特别 容易 受到 磁盘 故障 的 影响 。 


其 中 最 简单 的 数据 库 实现 是 将 数据 库 文件 存储 在 直接 连接 到 数据 库 服务 器 的 本 地 磁盘 子 系 统 上 。 显 然 ， 如 果 本 地 磁盘 子 系统 
出 现 故障 ， 数 据 库 将 变 得 不 可 用 。 通 常 需要 服务 器 重新 配置 新 的 磁盘 子 系统 ， 数 据 库 才 可 以 从 这 样 的 故障 中 恢复 。 另 一 种 恢复 方 
法 是 配置 一 个 全 新 的 数据 库 服 务 器 来 还 原 数据 库 。 如 果 发 生 故 障 的 磁盘 子 系统 可 以 修好 ， 这 两 种 方法 都 不 需要 。 


要 恢复 数据 库 ，DBA 可 以 使 用 备份 的 数据 库 文件 和 日 志 副 本 恢复 数据 。RAID 磁 盘 系 统 也 可 以 帮助 减少 中 断 ， 因 为 多 个 磁盘 
驱动 器 必须 出 现 故 障 ， 才 会 导致 中 断 。 第 18 章 对 RAID 存 储 提供 了 更 详细 的 介绍 。 


另外 一 种 情况 是 数据 库存 储 在 存储 区 域 网 络 (SAN) 。SAN 是 一 种 分 组 网 络 磁盘 设备 。 如 果 SAN 失 败 ， 数 据 库 将 可 能 变 得 
不 可 用 。 如 果 网 络 内 多 个 磁盘 驱动 器 出 现 故障 ，SAN 连 接 失 败 ， 或 出 现 断 电 的 情况 ，SAN 就 可 能 发 生 故 障 。 


故障 转移 系统 ， 如 备用 数据 库 ， 可 以 帮助 减少 由 磁盘 相关 的 故障 引起 的 中 断 。 有 了 备用 数据 库 ， 唯 一 可 能 会 丢失 数据 的 情况 
是 ， 故 障 发 生 时 有 事务 未 提交 。 


8.3.5 ”操作 系统 故障 


并 不 是 所 有 的 数据 库 可 用 性 问题 都 是 由 硬件 问题 引起 的 。 软 件 也 可 能 是 罪魁 祸首 。 例 如 ， 操 作 系 统 (OS) 发 生 故 障 或 中 断 
时 ， 数 据 将 不 可 用 ， 即 使 所 有 的 服务 器 硬件 都 是 可 操作 的 。 操 作 系统 中 断 的 典型 原因 包括 : 固有 缺陷 通用 操作 系统 不 稳定 ，OS 
版 本 升级 时 遇 到 问题 ， 或 者 应 用 修复 程序 时 发 生 故 障 。 


操作 系统 故障 或 中 断 时 ， 数 据 将 不 可 用 ， 即 使 所 有 的 服务 器 硬件 都 是 可 操作 的 。 


当 操 作 系统 友 生 故障 时 ， 恢 复数 据 可 用 性 的 唯一 选择 是 要 修复 操作 系统 问题 或 在 另 一 台 有 操作 系统 功能 的 服务 器 上 恢复 数据 
库 。 再 次 ， 可 以 使 用 故障 转移 系统 将 软件 故障 引起 的 停机 时 间 最 小 化 。 


8.3.6 ”DBMS 软 件 故 障 


与 操作 系统 故障 类 似 ，DBMS 软 件 的 故障 也 会 导致 不 可 用 。 如 果 DBMS 不 可 操作 ， 其 数据 库 中 的 数据 就 无 法 访问 。 与 操作 系 
统 故障 的 原因 类 似 : 固有 的 缺陷 ， 通 用 DBMS 不 稳定 ,升级 到 一 个 新 版 本 DBMS 时 遇 到 问题， 或 者 应 用 收复 程序 时 发 生 故 障 。 如 
果 不 提供 它 所 需要 的 资源 (如 启动 参数 ) ， 操 作 某 些 系 统 文 件 和 内 存 结构 时 ，DBMS 也 可 能 会 出 现 故 障 。 例 如 ， 如 果 数 据 库 的 日 
志文 件 损坏 或 丢失 ，DBMS 将 不 允许 修改 数据 。 


如 果 DBMS 不 可 操作 ， 其 数据 库 中 的 数据 就 无 法 访问 。 


总 之 ， 当 软件 有 缺陷 或 不 能 掌控 正确 运行 所 需 的 资源 时 ，DBMS 就 会 出 现 故 障 。 


8.3.7 ”应 用 程序 问题 


应 用 程序 软件 也 可 能 会 导致 可 用 性 问题 。 如 果 应 用 程序 是 终端 用 户 访问 数据 的 唯一 方法 ， 应 用 程序 出 现 故 障 时 ， 就 会 出 现 数 
据 不 可 用 问题 。 应 用 程序 软件 故障 不 会 导致 数据 库 中 断 ， 但 是 ， 如 果 用 户 无 法 使 用 他 们 一 贯 的 程序 来 访问 数据 ， 数 据 库 就 会 变 得 
毫 无 意义 。DBA 和 其 他 经 验 丰富 的 用 户 能 够 使 用 替代 方法 ， 如 交互 式 SQL 或 查询 工具 访问 数据 库 中 的 数据 。 


软件 缺陷 和 故障 ， 程 序 执行 模块 或 库 的 丢失 都 可 能 导致 应 用 程序 中 断 。 全 面 的 程序 测 坛 和 质量 保证 程序 ， 可 以 最 大 限度 地 减 
少 应 用 程序 中 断 的 发 生 。 


8.3.8 ”安全 和 授权 问题 


与 安全 相关 的 问题 是 数据 库 不 可 用 的 另 一 个 原因 。 这 类 问题 通常 是 由 使 用 不 当 或 数据 库 管 理 不 当 造 成 的 。 无 论 终端 用 户 直 接 
或 通过 程序 的 手段 访问 数据 ， 都 必须 经 过 授权 (通常 由 DBA 或 安全 管理 员 授 权 ) 。 无 论 何 种 理由 ， 如 果 请 求 的 代理 不 具有 访问 
当前 数据 库 的 权限 ， 那 么 数据 对 请 求 者 就 不 可 用 。 应 用 程序 投入 生产 后 或 者 一 个 新 用 户 尝 试 使 用 该 系统 ， 但 目前 尚未 获得 许可 ， 
通常 会 立即 出 现 安全 相关 的 问题 。DBA 错 误 也 可 能 会 导致 安全 相关 的 问题 : 如 果 DBA 意 外 重 写 或 删除 DBMS 的 有 效 授权 ， 有 效 
的 用 户 将 无 法 访问 数据 。 


确保 遵守 适当 的 安全 和 授权 程序 。 


为 了 避免 与 安全 相关 的 问题 ， 确 保 遵 守 适当 的 安全 和 授权 程序 。 变 更 数据 库 安全 时 要 格外 小 心 。 有 关 该 主题 的 更 多 信息 ， 请 
参阅 第 14 章 。 


8.3.9 ”数据 损坏 


数据 损坏 可 能 导致 不 可 用 。 即 使 硬件 和 系统 软件 都 完好 无 损 ， 数 据 库 也 可 以 变 得 不 可 用 ， 因 为 其 中 的 数据 不 准确 。 基 于 故障 
或 损坏 的 数据 的 业务 决策 将 会 对 业务 产生 负面 影响 。 数 据 损坏 的 原因 有 很 多 : 应 用 程序 错误 、DBMS 软 件 错误 、 数 据 库 设 计 不 佳 
或 用 户 错误 。 如 果 较 新 的 数据 遭 到 更 严格 的 质量 和 编辑 检查 ，| 旧 的 数据 也 可 能 是 错误 的 。 


数据 损坏 可 能 导致 不 可 用 。 
如 果 大 量 的 数据 损坏 ，DBA 需 要 将 数据 库 脱 机 。 大 多 数 DBMS 系 统 都 提供 这 样 操作 的 命令 。 如 果 数 据 库 不 脱 机 ， 不 仅 会 作出 


错误 的 业务 决策 ， 也 会 使 数据 的 损坏 程度 更 加 严重 ， 使 用 数据 的 进程 也 可 能 会 损坏 其 他 相关 数据 。DBA 需 要 尽早 采取 措施 使 数 
据 不 可 用 ， 以 减 小 所 造成 的 损害 。 毫 无 疑问 ,数据 库 脱 机 等 于 丢失 业务 。 


当 数 据 损坏 时 ，DBA 必 须 与 应 用 程序 专家 一 起 确定 哪些 数据 是 不 准确 的 ， 并 制订 计划 纠正 有 问题 的 数据 。 此 外 ， 他 们 必须 
找 出 损坏 的 原因 ， 并 采取 措施 纠正 。 这 是 一 项 非常 耗 时 的 任务 ， 需 要 付出 相当 多 的 努力 。 


确定 损坏 的 数据 以 后 ，DBA 和 应 用 程序 专家 也 许 能 够 恢复 数据 库 未 受到 影响 的 部 分 的 访问 ， 并 清除 那些 损坏 了 的 数据 。 然 
而 ， 在 识别 并 纠正 损坏 的 数据 之 前 ， 数 据 库 不 应 该 重新 上 线 进行 更 新 。 


数据 传输 失败 时 ， 可 能 造成 一 种 不 同类 型 的 可 用 性 问题 。 如 果 用 户 信任 数据 库 中 的 数据 是 准确 的 也 是 最 新 的 ， 即 使 数据 库 有 
准确 的 数据 ， 失 败 的 数据 传送 专线 也 可 以 使 数据 库 无 用 ， 因 为 不 能 确定 哪些 数据 是 最 新 的 哪些 不 是 。 这 样 的 故障 类 似 于 数据 损 
坏 ， 数 据 存 在 却 无 法 使 用 。 但 是 ， 纠 正 这 样 的 问题 ， 通 常 比 纠正 无 效 数据 容易 得 多 。 无 论 如 何 ，DBA 必 须 与 网 络 技术 人 员 和 SA 
一 起 识别 和 纠正 数据 传输 失败 。 一 旦 数据 传送 专线 可 用 ，DBA 需 要 迅速 加 载 新 的 数据 到 数据 库 中 ， 以 解决 可 用 性 问题 。 


8.3.10 ”数据 库 对 象 丢 失 


不 小 心 删除 数据 库 对 象 是 不 可 用 的 另 一 个 原因 。 如 果 删 除 一 个 表 空 间或 表 ， 其 中 的 数据 就 无 法 访问 。DBA 必 须 运 行 脚本 来 
重建 对 象 (包括 删除 的 任何 相关 对 象 ) ， 重 新 应 用 参照 约束 ， 重 建 授权 ， 然 后 重新 加 载 数据 ， 这 些 数 据 可 能 仍然 驻 留 在 磁盘 设 
备 。 某 些 DBMSs 产 品 和 附加 工具 ， 可 以 让 这 类 数据 恢复 更 加 方便 。 如 果 没有 这 种 技术 ， 需 要 根据 备份 文件 和 归档 日 志 恢复 数据 。 


不 小 心 删除 数据 库 对 象 是 不 可 用 的 另 一 个 原因 。 


如 果 删 除 某 个 索引 ， 数 据 仍 可 以 访问 ， 但 性 能 通常 会 受到 影响 。 如 果 性 能 非常 糟糕 ， 用 户 可 能 会 认为 数据 库 不 可 用 。 例 如 ， 
假设 一 个 进程 ， 从 数 百 万 行 的 表 返 回 一 行 。 如 果 使 用 索引 ， 访 问 速度 会 很 快 ， 因 为 只 需要 少量 的 I/O 操 作 读 取 索 引 ， 然 后 使 用 指 
向 表 中 数据 的 直接 指针 执行 一 次 VO (通常 情况 下 ) 来 读 取 数 据 。 没 有 索引 ，DBM 将 扫描 所 有 行 并 返回 单个 行 ， 人 花费 的 时 间 可 
能 以 天 计算 ， 也 可 能 是 几 个 小 时 ， 这 取决 于 DBMS、 硬 件 和 系统 环境 。 


删除 视图 将 导致 依靠 视图 访问 数据 库 的 用 户 和 进程 的 可 用 性 问题 。 删 除 视图 不 会 删除 任何 数据 库 中 的 数据 ， 它 只 是 从 系统 中 
删除 该 视图 的 定义 。 然 而 ， 如 果 一 个 用 户 只 通过 该 视图 访问 数据 库 ， 删 除了 视图 该 用 户 就 无 法 访问 。 为 了 解决 这 个 问题 ，DBA 
需要 重建 视图 ， 重 新 应 用 视图 授权 ， 并 重新 绑 定 应 用 程序 包 或 计划 (取决 于 DBMS 以 及 如 何 使 用 DBMS) 。 


错误 地 删除 数据 库 对 象 ， 通 常 是 DBA 的 人 为 错误 。 然 而 ， 为 不 熟练 的 人 授予 类 似 DBA 的 数据 库 权 限 ， 也 可 能 会 导致 这 种 结 
果 。 通 过 创建 和 确保 适当 的 数据 库 安 全 并 对 DBA 提 供 深入 的 培训 ， 可 以 最 大 限度 地 减少 数据 库 对 象 的 意外 删除 。 有 些 第 三 方 工 
具 可 以 自动 恢复 删除 的 数据 库 对 象 。 


8.3.11 数据 丢失 


数据 不 存在 也 可 能 会 导致 数据 不 可 用 ， 如 果 错 误 地 删除 或 覆盖 数据 ， 就 可 能 发 生 这 种 情况 。 大 规模 删除 、 应 用 程序 错误 ， 其 
至 恶意 攻击 ， 都 可 能 导致 数据 丢失 。 


大 规模 删除 、 应 用 程序 错误 ， 甚 至 恶意 攻击 ， 都 可 能 导致 数据 委 失 。 


当 错 误 删 除数 据 时 ，DBA 可 能 需要 将 数据 库 恢复 到 数据 删除 前 的 某 个 时 间 点 。 这 可 以 通过 使 用 DBMS 的 恢复 或 还 原 功 能 实 
现 。DBA 检 查 事务 日 志 确 定 错误 的 发 生 时 间 ， 然 后 将 数据 恢复 到 错误 之 前 的 时 间 点 。 分 析 并 解释 数据 库 事 务 日 志 的 内 容 是 一 项 
非常 困难 的 任务 ， 但 目前 也 有 第 三 方 工具 ， 可 以 简化 这 一 任务 。 


如 果 你 使 用 的 是 备用 数据 库 ， 还 有 可 能 在 数据 丢失 时 避免 中 断 。 在 将 日 志 转 移 到 辅助 数据 库 的 过 程 中 ， 如 果 延 迟 时 间 足 够 
长 ， 可 能 不 会 将 错误 引入 备用 数据 库 。 在 这 种 情况 下 ， 可 以 切换 到 辅助 数据 库 并 纠正 主 数据 库 ( 脱 机 ) 。 


8.3.12 ”数据 复制 和 传播 故障 


为 了 与 不 同 数据 库 中 的 数据 保持 同步 ， 许 多 数据 库 都 参与 复制 和 传播 过 程 。 如 果 复 制 或 传播 任务 失败 ， 数 据 仍然 可 以 访问 ， 
但 它 可 能 不 会 成 为 用 户 期 望 的 最 新 数据 。 


复制 与 传播 故障 有 两 种 情况 : 一 种 是 作为 用 户 参与 的 数据 库 ; 另 一 种 是 作为 发 布 方 参与 的 数据 库 。 用 户 收 到 发 布 方 的 复制 或 
传播 数据 。 因 为 发 布 方 未 能 复制 或 传播 变更 ， 所 以 用 户 数据 库 中 的 数据 可 能 不 是 最 新 的 。 出 现 这 样 的 问题 的 原因 可 能 有 很 多 ， 包 
括 连 接 问 题 、 软 件 故障 或 调度 错误 。 无 论 如 何 ， 如 果 用 户 数据 库 中 的 数据 不 是 最 新 的 ， 将 会 导致 可 用 性 问题 。 


第 二 类 问题 可 能 是 发 布 方 数 据 库 的 问题 。 如 果 发 布 任务 失败 ， 发 布 方 的 数据 是 最 新 的 ， 但 如 果 解 决 了 复制 或 传播 的 问题 ， 重 
新 开始 服务 ， 发 布 方 会 向 用 户 发 送 大 量 的 数据 ， 试 图 更 新 用 户 的 数据 ， 此 时 可 能 会 对 性 能 产生 影响 。 如 果 性 能 严重 退化 ， 也 可 能 
会 导致 可 用 性 问题 。 不 管 何 种 情况 ，DBA 都 需要 开发 程序 ， 检 测 复 制 与 传播 中 断 ， 迅 速 恢 复 复制 或 传播 过 程 。 


8.3.13 ”严重 的 性 能 问题 


严重 的 性 能 问题 可 能 会 导致 不 可 用 。 即 使 数据 库 在 技术 上 是 可 用 的 (数据 准确 ， 在 操作 硬件 上 运行 ) ， 性 能 不 佳 也 可 能 导 
数据 库 不 可 用 。 任 何 问 题 都 可 能 导致 性 能 不 佳 ， 包 括 损坏 的 索引 、 定 义 不 正 确 的 索引 、 数 据 的 增长 、 额 外 的 用 户 、 过 时 的 数据 库 
统计 和 锁定 问题 。 终 端 用 户 不 关心 原因 ， 他 们 只 希望 自己 的 应 用 程序 可 以 工作 。 因 此 ， 从 技术 上 看 ， 尽 管 性 能 问题 不 是 可 用 性 问 
题 ， 但 DBA 必 须 将 其 视 为 非常 严重 的 问题 ， 可 以 削弱 终端 用 户 访问 数据 的 能 力 。 


性 能 不 佳 可 能 导致 数据 库 不 可 用 。 


有 关 监测 、 调 整 和 管理 数据 库 性 能 的 更 多 信息 ， 请 参阅 第 9~ 第 12 章 。 


8.3.14 ”恢复 问题 


企业 的 数据 库 备份 和 恢复 策略 ， 将 影响 数据 库 系统 的 可 用 性 。 有 多 种 技术 和 方法 可 用 于 备份 和 恢复 数据 库 。 有 些 比 较 昂贵 的 
技术 ， 还 可 以 通过 更 迅速 地 恢复 数据 来 增强 可 用 性 。 


当务之急 ，DBA 团 队 应 该 为 每 个 数据 库 对 象 创建 合适 的 恢复 策略 。 对 于 具有 高 可 用 性 要 求 的 数据 ， 备 份 和 恢复 策略 应 提供 
最 短 的 平均 恢复 时 间 。 当 数据 库 崩 溃 后 ， 要 求 数据 库 环 境 尽快 恢复 时 ， 使 用 最 有 效 的 备份 和 恢复 技术 至 关 重 要 。 影 响 可 恢复 性 和 
可 用 性 恢复 的 因素 包括 操作 系统 配置 、 硬 件 结构 设计 、 数 据 库 功能 、 备 份 频率 以 及 恢复 规范 和 流程 。 


许多 现代 磁盘 阵列 使 用 动态 镜像 和 其 他 创造 性 的 技术 ， 提 供 即 时 复制 和 恢复 数据 。 通 过 使 用 存储 硬件 技术 ，DBA 可 以 显著 
减少 数据 库 备份 恢复 的 影响 。 一 定 要 调查 可 用 的 存储 解决 方案 ， 并 使 用 其 内 置 功能 ， 提 高 数据 的 可 用 性 。 


此 外 ， 创 建 要 求 极 高 可 用 性 的 应 用 程序 时 ， 一 定 要 调查 DBMS 的 高 可 用 性 和 恢复 功能 。 例 如 ， 参 阅 “DB2 HADR” #0 “SQL 
Server 2012: AlwaysOn” 。 


第 16 章 深入 介绍 了 数据 库 备份 和 恢复 规范 ， 以 及 提高 数据 库 可 用 性 的 流程 。 


8.3.15 ”DBA 错 误 


数据 库 停机 的 最 大 原因 之 一 是 人 为 错误 。 事 实 上 ， 一 个 主要 的 DBM S 供 应 商 指出 ， 在 其 接收 到 的 有 关 数 据 库 中 断 的 电话 中 ， 
有 70% 都 是 DBA 的 失误 。 虽然 不 能 保证 以 后 不 再 出 现 这 种 错误 ,但 正确 的 DBA 培 训 和 工具 ， 可 以 最 大 限度 地 减少 错误 。 


数据 库 停机 的 最 大 原因 之 一 是 人 为 错误 。 
DB2 HADR 
DB2 高 可 用 性 灾难 恢复 (HADR) 是 一 个 数据 复制 功能 ， 对 部 分 和 整个 站 点 故障 提供 高 可 用 性 解决 方案 。 它 是 Linux、UNIX 


和 \Windows 平 台 上 的 DB2 功 能 ， 是 从 Informix 移 植 过 来 的 。 


HADR 通 过 从 源 数据 库 ( 主 机) 复制 数据 变更 到 目标 数据 库 〈 备 用 机 ) 来 防止 数据 丢失 。 没 有 HADR， 在 发 生 故 障 
时 ，DBMS 服 务 器 重新 启动 。 重 新 启动 数据 库 和 机 器 所 需 的 时 间 是 高 度 不 可 预测 的 ， 从 几 分 钟 到 更 长 的 时 间 。 通 过 HADR， 备 用 
数据 库 可 以 在 几 秒 钟 内 解决 问题 。 客 户 使 用 自动 客户 端 重新 路 由 或 重 试 应 用 程序 中 的 逻辑 就 可 以 重 定向 到 备用 数据 库 。 


HADR 人 允许 备用 数据 库 接管 主 数据 库 中 整个 DB2 功 能 。 原 始 主 数据 库 也 可 以 恢复 到 之 前 的 状态 。 
SQL Server 2012: AlwaysOn 


SQL Server 201238 it AlwaysOn SQL Server 故 障 转移 集群 实例 和 AlwaysOn 可 用 性 组 提高 可 用 性 。 这 些 AlwaysOn 功 能 提供 了 更 好 


的 数据 库 正常 运行 时 间 和 数据 保护 。 


AlwaysOn SQL Server 故 障 转移 集群 实例 使 多 个 子 网 故障 转移 集群 ， 其 中 每 个 故障 转移 集群 节点 都 连接 到 不 同 的 子 网 或 不 同 子 
网 组 。 没 有 共享 的 数据 存储 ， 所 以 数据 需要 在 多 个 子 网 之 间 复 制 。 这 也 有 助 于 提高 灾难 恢复 。 灵 活 的 故障 切换 策略 在 出 现 故 障 的 
情况 下 ， 将 组 的 所 有 权 转 移 到 另 一 个 节点 。 


AlwaysOn 还 额外 提供 创建 可 用 性 组 ， 其 中 定义 了 一 组 数据 库 作 为 一 个 单元 进行 故障 转移 ， 以 及 一 组 可 用 性 副本 ， 用 于 承载 
每 个 可 用 性 数据 库 的 副本 。 可 以 部 署 AlwaysOn 可 用 性 组 来 提高 数据 库 的 可 用 性 : 通过 创建 多 个 辅助 副本 ， 提 供 异 步 和 同步 提交 
模式 和 部 署 各 种 故障 转移 模式 ， 以 及 其 他 益处 。 


确保 所 有 的 DBA 已 接受 适当 的 培训 ， 然 后 让 他 们 负责 关键 生产 数据 库 系 统 。 培 训 应 包括 两 个 课程 材料 (教师 指导 或 基于 计 
算 机 的 培训 ) 和 工作 经 验 。DBA 的 第 一 次 管理 经 验 应 该 是 和 测试 系统 一 起 的 ， 而 不 是 生产 数据 。 


此 外 ， 第 三 方 工具 可 以 大 大 减少 保持 数据 库 启动 和 运行 所 需 的 努力 。 数 据 库 性 能 监视 器 在 发 生 中 断 时 可 以 立即 通知 DBA。 
一 些 简 单 的 问题 ， 如 “空间 不 足 ” 可 以 由 主动 的 性 能 工具 解决 ， 因 为 在 发 生 问 题 之 前 ， 可 以 通过 设置 它们 来 警告 潜在 的 问题 。 得 
到 警告 后 ，DBA 可 以 采取 纠正 措施 ， 避 免 可 能 造成 停机 的 潜在 的 破坏 性 问题 。 


一 些 数据 库 性 能 工具 可 以 提供 主动 触发 器 。 设 置 以 后 可 以 自动 纠正 出 现 的 问题 。 其 他 DBA 工 具 (如 恢复 管理 程序 和 先进 的 
重组 工具 ) 可 迅速 解决 遇 到 的 问题 。 有 关 DBA 工 具 的 更 多 详细 信息 ， 请 参阅 第 23 章 。 


8.3.16 计划 内 和 计划 外 中 断 


当 讨 论 中 断 和 停机 时 间 时 ， 许 多 技术 人 员 会 立刻 想到 计划 外 中 断 。 人 为 错误 、 软 件 错误 和 故障 、 硬 件 故 障 都 会 导致 计划 外 中 
断 。 然 而 ， 实 际 上 造成 停机 的 大 多 都 是 计划 内 停机 ( 见 图 8-1) 。 计 划 内 停机 是 由 于 定期 调度 系统 和 数据 库 维 护 任务 ， 需 要 数据 
库 脱 机 ， 例 如 ， 数 据 库 重组 或 变更 。 


30% 


的 中 断 
70% 
Ay He r 


应 用 程序 可 用 性 
计划 内 中 断 
国 计划 外 中 断 
图 8-1 计划 内 和 计划 外 中 断 
大 多 数 停机 实际 上 是 计划 内 中 断 引 起 的 。 


计划 内 中 断 占 据 了 70% 的 停机 时 间 ， 计 划 外 中 断 占 据 了 另外 30%。 此 外 ， 研 究 表明 ， 多 达 50% 的 计划 外 中 断 是 由 于 计划 内 中 
断 过 程 中 遇 到 了 问题 。 因 此 ， 如 果 大 部 分 中 断 由 计划 行为 引起 ， 那 么 DBA 应 该 集中 更 多 的 注意 力 在 开发 技术 上 ， 避 免 在 计划 内 
数据 库 变更 和 维护 活动 中 发 生 中 断 。 假 设 由 于 计划 外 中 断 ，DBA 肯 定 需要 准备 停机 。 然 而 ， 由 于 计划 内 中 断 实际 上 会 对 可 用 性 
造成 更 大 的 影响 ，DBA 通 过 开发 技术 来 减少 计划 内 中 断 ， 就 可 以 获得 更 有 利 的 影响 。 


8.4 确保 可 用 性 


当今 DBA 的 工作 充满 了 挑战 ， 是 时 候 将 工作 重点 转移 到 一 些 可 以 提高 可 用 性 的 技术 上 了 。 面 对 紧缩 的 预算 和 资源 ， 要 管理 
的 数据 不 断 增 加 ，IT 企 业 需 要 评估 它们 的 关键 需求 并 实施 一 系列 重要 的 战略 步骤 ， 以 确保 可 用 性 。 良 好 的 战略 步骤 应 该 包括 : 


* 系统 正常 运行 时 执行 日 常 维护 。 


.自动 化 DBA 的 一 些 任务 。 


利用 DBMS 的 功能 促进 可 用 性 。 


利用 硬件 技术 。 


8.4.1 系统 正常 运行 时 执行 日 剃 维护 


为 了 解决 用 较 少 的 IT 人 员 和 预算 满足 优化 性 能 的 需要 ， 关 键 是 要 采用 可 以 简化 和 自动 化 维护 功能 的 产品 。DBA 需 要 将 维护 时 
间 从 几 小 时 缩短 到 几 分 钟 甚至 不 需要 时 间 ， 同 时 允许 用 户 继续 访问 他 们 需要 的 数据 。 某 些 DBMS 产 品 提供 内 置 功能 来 执行 一 些 维 
护 任 务 ， 同 时 数据 库 是 可 用 的 。 如 果 DBMS 不 提供 本 地 支持 ，ISV 的 一 些 工具 也 可 以 提供 额外 的 数据 库 可 用 性 。 关 键 是 数据 库 实 
用 程序 的 功能 不 间断 。 


数据 库 实用 程序 的 功能 不 间断 。 


不 间断 的 实用 程序 是 一 项 任务 ， 执 行 数据 库 维护 过 程 的 同时 更 新 和 读 取 数 据 库 ， 这 样 不 会 损失 数据 的 完整 性 。 部 署 不 间断 的 
实用 程序 需要 注意 进行 不 间断 操作 所 需 资源 的 数量 和 类 型 。 一 般 情况 下 ， 本 地 数据 库 实 用 程序 使 用 CPU 和 IO 资源 的 机 会 比 使 用 
ISV 实 用 程序 解决 方案 更 多 ，1SV 可 能 比较 昂贵 。 需 要 最 多 的 不 间断 的 实用 程序 类 型 ,包括 


" 数据 库 重 组 ， 维 持 性 能 。 

* 数据 库 备 份 ， 确 保 在 应 用 程序 或 硬件 故障 的 情况 下 可 以 恢复 数据 ， 除 了 灾难 恢复 准备 。 
“ 数据 库 恢复 解决 方案 ， 可 以 应 用 恢复 的 数据 ， 而 无 需 停 机 。 

+ 卸载 和 加 载 过 程 ， 在 用 于 决策 支持 系统 和 数据 仓库 的 源 数 据 和 业务 数据 之 间 移 动 数据 。 
© 统计 数据 收集 工具 ， 可 以 分 析 数 据 特点 和 数据 库 优 化 程序 使 用 的 记录 统计 。 

+ 完整 性 检查 工具 ， 参 照 完整 性 和 结构 数据 完整 性 。 


其 中 一 个 例子 是 在 线 数 据 库 重 组 。 通 常情 况 下 ， 在 线 REORG 是 通过 制作 数据 副本 ， 并 重组 副本 进行 的 。 读 取 和 写 入 访问 在 
原来 的 数据 上 继续 。 当 阴影 副本 重组 完成 后 ，REORG 过 程 使 用 数据 库 日 志 捕 捉 原 始 数据 上 的 数据 修改 ， 并 将 其 应 用 到 复制 中 。 
此 过 程 是 迭代 的 ， 并 且 可 能 需要 进行 多 次 。 如 果 阴 影 副本 已 经 与 原件 相同 ， 切 换 数据 集 : 副本 将 变 为 原件 ， 将 原件 删除 。 在 这 种 
方式 下 ，DBA 可 以 重组 数据 库 并 尽量 做 到 不 影响 可 用 性 。 在 第 11 章 中 有 数据 库 重组 的 更 详细 介绍 。 


但 要 记 住 ， 大 多 数 数 据 库 维护 任务 都 会 影响 可 用 性 。 进 行 数据 备份 、 数 据 恢复 、 检 查 数据 是 否 违反 完整 性 、 捕 捉 数 据 库 统计 
信息 、 将 新 数据 加 载 到 数据 库 ， 都 可 能 会 对 可 用 性 产生 不 利 影响 。 与 现代 存储 设备 一 起 减少 或 消除 停机 时 间 的 工具 ， 在 数据 库 正 
常 运 行 的 同时 ， 用 于 维护 数据 库 也 非常 有 用 。 某 些 存储 设备 可 以 进行 快速 文件 扫描 。 执 行 数据 库 维 护 任务 时 可 以 利用 这 种 技术 ， 
可 以 将 中 断 从 几 分 钟 或 几 小 时 减少 到 几 秒 钟 。 


大 多 数 数据 库 维 护 任务 都 会 影响 可 用 性 。 


数据 库 变更 是 对 可 用 性 的 一 种 威胁 。 对 可 用 性 的 影响 取决 于 变更 类 型 ， 以 及 DBMS 如 何 实现 这 一 变更 。 如 果 使 用 ALTER 语 名 
就 可 以 修改 ， 会 对 可 用 性 产生 一 些 影 响 ， 但 问题 不 大 ， 因 为 这 种 类 型 的 变更 很 快 就 可 以 完成 。 变 更 数据 对 象 对 可 用 性 的 影响 较 
大 。 数 据 库 对 象 的 结构 定义 发 生变 更 时 ，DBMS 经 常会 使 数据 不 可 用 。 


随 着 变更 类 型 越 来 越 复杂 ， 对 可 用 性 的 影响 也 越 来 越 大 。DBMS 供 应 商 正 在 改良 他 们 的 产品 ， 使 它们 能 够 不 打 断 数据 库 的 变 


更 ， 如 IBM 的 数据 库 需 求 定义 (W “IBM DB2: 数据 库 需 求 定义 ”) 。 某 些 变更 需要 删除 对 象 和 数据 。 显 然 ， 这 样 的 变更 会 导 
致 中 断 。 变 更 所 需 的 时 间 越 长 ， 中 断 就 越 长 。 使 用 高 速 加 载 和 印 载 工具 可 以 减少 中 断 的 持续 时 间 。 接 下 来 要 讨论 的 主题 ， 自 动 化 
变更 ， 可 以 进一步 减少 不 可 用 。 有 关 实 现 数据 库 变更 的 更 多 信息 ， 请 参阅 第 7 章 。 


IBM DB2: 数据 库 需 求 定义 


IBM 走 上 了 在 线 模式 演进 的 道路 ， 如 DB2 V8 允许 DB2 数 据 库 修改 ， 而 不 会 造成 中 断 。DB2 的 每 个 后 续 版 本 都 可 以 进行 额外 的 
变更 而 不 产生 中 断 。 


例如 ， 过 去 一 些 DB2 版 本 中 引入 的 改进 的 变更 管理 功能 包括 延长 列 的 长 度 、 变更 列 的 数据 类 型 、 添加 列 到 索引 、 变更 分 区 特 
性 和 改进 的 实用 程序 支持 等 。 


随 着 时 间 的 推移 ， 主 动 数据 库 需 求 定 义 将 使 变更 DB2 数 据 库 更 加 容易 ， 且 不 会 造成 任何 停机 。 


8.4.2 自动 化 DBA 任 务 


在 DBA 程 序 中 创建 更 多 的 自动 化 ， 可 以 提高 数据 库 和 应 用 程序 的 整体 可 用 性 。 如 果 创 建 正确 ， 自 动 执行 任务 失败 的 概率 比 
手动 执行 更 低 。 人 会 犯错 误 ， 电 脑 不 会 (除非 人 为 错误 操作 ) 。 所 以 ， 任 务 越 复杂 ， 使 用 自动 化 受益 越 大 。 


实现 数据 库 变更 是 一 项 复杂 的 任务 。 因 此 ， 自 动 化 变更 在 理论 上 可 以 提高 可 用 性 。 如 果 某 种 自动 化 的 DBA 工 具 既 了 解 
DBMS， 又 知道 如 何 对 数据 库 对 象 进行 变更 ， 使 用 它 将 可 以 大 大 减少 潜在 的 人 为 错误 。 此 外 ，DBA 手 动 生成 变更 脚本 所 花费 的 时 
间 是 变更 管理 工具 生成 变更 脚本 所 花费 时 间 的 好 几 倍 。 而 且 ， 工 具 出 现 错误 的 可 能 性 极 小 。 所 以 ， 有 了 自动 化 的 数据 库 变更 ， 分 
析 需 要 进行 的 变更 ， 开 发 进行 变更 的 脚本 ， 以 及 运行 脚本 实际 执行 数据 库 变更 ， 所 有 这 些 操作 需要 的 时 间 就 更 少 了 。 总 体 而 言 ， 
变更 过 程 实现 自动 化 是 可 用 性 的 一 个 好 处 。 


自动 化 变更 可 以 提高 可 用 性 。 


另 一 项 任务 ， 数 据 库 备 份 和 恢复 也 可 以 从 自动 化 受益 。 发 生 中 断 或 灾难 后 ， 为 了 确保 公司 可 以 尽快 地 检索 数据 ， 预 先 计 划 很 
有 必要 。 主 动 进行 备份 和 恢复 管理 与 被 动 /不 进行 备份 和 恢复 管理 之 间 的 差异 ， 可 能 就 是 发 生 短 时 间 的 中 断 时 ， 无 数据 丢失 和 业 
务 很 难 恢复 的 差异 。 大 多 数 数 据 库 系统 和 应 用 程序 都 很 少 提供 自动 备份 和 恢复 ， 也 不 提供 开启 主动 恢复 计划 的 功能 。DBA 需 要 
的 产品 ， 既 可 以 频繁 备份 又 不 会 对 在 线 系统 施加 多 大 的 影响 。 对 备份 和 恢复 软件 额外 的 要 求 是 恢复 数据 的 顺序 与 其 支持 的 业务 应 
用 程序 的 重要 性 成 正比 。 一 旦 中 断 需要 恢复 ，DBA 就 可 以 使 用 备份 和 数据 库 日 志 确 保 每 个 数据 库 对 象 都 能 正确 恢复 。 这 需要 对 
DBMS、 应 用 程序 和 环境 都 非常 了 解 。 通 过 分 析 情 况 并 建立 在 最 短 时 间 内 就 可 以 将 系统 恢复 的 恢复 脚本 ， 附 加 产品 可 以 帮助 自动 
恢复 一 些 危险 情况 。 有 天数 据 库 备 份 和 恢复 的 深入 讨论 ， 请 参阅 第 16 章 和 第 17 章 。 


8.4.3 利用 高 可 用 性 功能 
如 果 DBMS 能 够 与 集群 和 并 行 技术 一 起 工作 ， 数 据 库 也 要 能 够 与 该 技术 很 好 地 配合 。 越 来 越 多 的 DBMS 供 应 商 开 始 调整 它们 
的 软件 使 其 具有 现代 硬件 和 操作 系统 的 功能 。 


由 于 互联 网 鞍 勃 发 展 的 需要 以 及 DBMS 和 应 用 程序 的 Web 支 持 ， 大 多 数 DBMSs 供 应 商都 在 优先 考虑 一 些 额外 的 可 用 性 功 
能 。 每 个 DBMS 的 新 版 本 都 引入 了 可 用 性 选项 和 功能 ， 可 以 用 来 提高 正常 运行 时 间 和 可 用 性 。 有 两 个 明显 的 例子 涉及 实用 程序 和 


数据 库 系 统 参数 。 运 行 实用 程序 和 变更 系统 参数 ， 传 统 上 是 需要 中 断 才 可 以 进行 的 任务 。 在 许多 情况 下 ， 运 行 实 用 程序 需要 使 数 
据 库 对 象 脱 机 。 同 样 地 ， 变 更 系统 参数 时 整个 DBMS 也 必须 停 下 来 。 然 而 ，DBMS 供 应 商 致 力 于 攻克 这 一 难题 。 在 一 些 较 新 的 
DBMS 版 本 中 (例如 ，DB2 中 用 于 z/OS 的 SET SYSPARM 命 令 ) ， 不 需要 停 人 DBM 就 可 以 变更 系统 参数 。DBA 应 该 重新 审视 那 
些 不 要 求 数据 库 可 用 的 旧 任务 ， 看 看 是 否 可 以 对 它们 进行 重新 设计 ， 执 行 时 不 需要 数据 库 或 DBMS 脱 机 。 


8.4.4 ”利用 集群 技术 


集群 [1 是 提高 服务 器 可 靠 性 的 一 个 选项 。 很 简单 ， 一 个 集群 是 一 组 互相 连接 的 服务 器 。 服 务 器 群集 的 实际 实施 范围 很 广 ， 可 
以 从 共享 存储 的 计算 机 ， 到 借助 特殊 软件 在 不 同 服务 器 之 间 重 新 分 配 工作 量 的 服务 器 组 。 


公司 一 般 倾 向 于 使 用 集群 来 提高 可 用 性 和 可 扩展 性 。 在 系统 出 现 故障 时 ， 集 群 提供 的 备用 选项 可 以 改进 系统 的 可 用 性 。 集 群 
涉及 多 个 彼此 独立 的 计算 系统 。 所 以 ， 如 果 其 中 任何 系统 出 现 故障 ， 集 群 软 件 都 可 以 将 该 系统 的 工作 分 配给 集群 中 的 其 他 系统 。 
这 对 用 户 是 透明 的 (对 于 用 户 来 说 ， 集 群 就 是 一 个 服务 器 ) ， 他 们 依赖 的 资源 仍然 可 用 。 


大 多 数 公司 认为 ， 集 群 的 主要 好 处 是 可 以 增强 可 用 性 。 在 某 些 情况 下 ， 集 群 可 以 帮助 企业 实现 “五 个 九 ” (99.999%) 的 可 
用 性 。 集 群 的 一 大 优点 是 可 以 通过 增加 一 台 服 务 器 或 节点 到 集群 中 提高 计算 能 力 。 由 于 拓展 业务 或 宣传 时 ， 吞 吐 量 增加 ， 通 过 增 
加 更 多 的 服务 器 可 以 保证 系统 正常 运行 。 


通过 增加 更 多 的 服务 器 可 以 保证 系统 正常 运行 。 


集群 提供 了 可 扩展 性 优势 。 当 负载 超过 组 成 集群 的 所 有 系统 的 能 力 时 ， 你 可 以 逐步 增加 更 多 的 资源 到 系统 中 ， 增 加 集群 的 计 
算 能 力 并 满足 各 种 处 理 需 求 。 随 着 数据 流量 或 可 用 性 保证 的 增加 ， 所 有 或 一 部 分 集群 的 大 小 或 数量 也 需要 增加 。 


另 一 个 优点 是 可 靠 性 。 有 些 集群 的 故障 切换 软件 ， 在 一 台 服 务 器 出 现 故 障 时 ， 可 以 将 该 服务 器 的 工作 量 重新 分 配给 其 他 服务 
器 。 这 增加 了 可 靠 性 ， 最 大 限度 地 减少 了 停机 时 间 ， 并 提高 了 可 用 性 。 集 群 中 的 每 个 节点 都 与 其 他 节点 保持 通信 。 当 一 个 节点 失 
去 联系 时 ， 集 群 便 认定 出 现 故 障 ， 随 即 启动 故障 转移 过 程 。 

对 集群 进行 配置 ， 使 其 以 不 同 的 方式 进行 故障 转移 。 例 如 ， 当 一 个 节点 出 现 故 障 时 ， 故 障 切 换 可 以 直接 将 处 理 交 给 不 同位 置 
的 男 一 个 节点 。 某 些 配置 集群 可 以 有 额外 的 节点 ， 且 该 节点 通常 是 闲置 的 。 当 发 生 故 障 转移 时 ， 闲 置 节点 接管 故障 节点 的 任务 ， 
集群 的 能 力 不 会 受到 损害 。 此 外 ， 基 于 容量 和 吞吐 量 ， 故 障 转移 还 可 以 将 任务 传播 到 其 他 存在 的 节点 。 

负载 平衡 与 高 可 用 性 

IT 专业 人 员 通 常 将 高 可 用 性 〈 如 Windows 集 群 、SAN 的 复制 等 ) 错误 地 理解 成 负载 平衡 。 负 载 平衡 是 一 种 跨 多 人 台 计 算 机 《或 
一 个 群集 、 网 络 链接 、 磁 盘 驱动 器 ， 或 其 他 资源 ) 分 配 工作 量 的 方法 ， 可 以 优化 资源 利用 率 ， 最 大 限度 地 提高 吞吐 量 ， 减 少 响应 
时 间 ， 并 避免 超载 。 负 载 平 衡 通常 通过 专用 的 软件 和 硬件 实现 。 

高 可 用 性 不 是 平衡 。 使 数据 库 具 有 高 可 用 性 的 方法 有 很 多 ， 主 要 取决 于 你 的 预算 。 但 要 使 一 个 数据 库 应 用 程序 在 基础 设施 的 
数据 库 端 达到 负载 平衡 ， 可 用 的 方法 却 不 多 。 


集群 可 以 提高 可 用 性 ， 因 为 可 以 将 出 现 故 障 的 某 些 节点 从 集群 中 删除 而 不 需要 中 断 。 节 点 故障 解决 以 后 ， 它 可 以 重新 加 入 群 
集 。 这 可 能 需要 也 可 能 不 需要 中 断 ， 取 决 于 集群 是 如 何 实现 的 。 


鉴于 所 有 这 些 优点 ， 每 个 IT 企业 还 有 什么 理由 不 选择 集群 配置 ”当然 ， 最 主要 的 原因 是 成 本 。 集 群 需要 多 台 机 器 ， 多 台 机 器 
总 是 比 一 台 机 器 的 成 本 高 ， 至 少 在 最 初 阶段 。 另 一 个 考虑 是 ， 可 能 需要 对 应 用 程序 进行 修改 ， 从 而 导致 故障 转移 ， 这 取决 于 集群 


大 多 数 操作 系统 都 支持 某 种 程度 的 集群 。 如 果 一 台 服 务 器 出 问题 ，Windows 服 务 器 可 以 故障 转移 。1BM 的 大 型 机 集群 可 以 
完全 共享 系统 资源 ， 并 且 所 有 的 意图 和 目的 就 像 是 一 个 系统 。 此 外 ， 从 数据 库 的 角度 来 看 ， 要 了 解 并 利用 操作 系统 支持 的 集群 ， 
需要 编写 DBMS 软 件 。 某 些 DBM S 产 品 在 这 方面 做 得 比较 好 。 


此 外 ， 集 群 还 可 以 用 于 掩盖 日 常 维护 工作 的 影响 。 当 一 个 服务 器 节点 需要 脱 机 进行 维护 时 ， 其 工作 可 以 转移 到 另 一 台 服 务 
器 。 例 如 ， 如 果 一 台 服 务 器 的 主板 需要 添加 内 存 ， 必 须 先 关闭 这 人 台 服 务 器 。 如 果 该 服务 器 加 入 了 集群 ， 在 对 其 进行 维护 的 同时 ， 
还 可 以 将 工作 量 路 由 到 集群 中 的 其 他 节点 ， 这 会 减少 因 维 护 任务 而 造成 的 中 断 。 


集群 可 以 用 于 掩盖 日 常 维护 工作 的 影响 。 
集群 的 类 型 

共享 磁盘 和 无 共享 架构 是 集群 的 主要 方法 。 用 这 两 个 名 字 来 描述 每 种 类 型 是 相当 准确 的 。 第 2 章 有 这 些 类 型 集群 的 概述 。 

从 本 质 上 讲 ， 无 共享 和 共享 磁盘 提供 了 两 种 不 同 的 集群 技术 。 无 共享 的 集群 架构 是 大 多 数 计 算 和 数据 库 实现 使 用 的 主要 集群 
架构 。 可 扩展 性 和 性 能 是 无 共享 集群 的 标志 ， 并 使 其 成 为 分 析 和 数据 仓库 应 用 程序 的 理想 选择 。 共 享 磁盘 集群 需要 控制 工具 来 管 


理 共享 数据 的 访问 。 共 享 磁盘 集群 是 处 理 数 据 仓库 工作 负载 的 理想 选择 ， 因 为 它们 的 只 读 性 质 不 要 求 锁定 ， 因 此 不 会 以 OLTP 工 
作 负 载 的 方式 强调 共享 磁盘 系统 。 


几 个 数据 库 示例 


Oracle 备 用 数据 库 是 集群 的 一 个 简单 例子 。 主 数据 库 镜像 到 备用 数据 库 ， 发 生 故 障 时 ， 备 用 数据 库 可 以 介入 并 接管 。 尽 管 
元 余 的 成 本 很 高 ， 但 对 无 法 承受 长 时 间 中 断 的 企业 来 说 ， 这 也 符合 成 本 效益 。 


Oracle 的 另 一 个 与 集群 相关 的 、 高 可 用 性 功能 是 Real Application Clusters (RAC) 支持 。RAC 提 供 单个 数据 库 跨 多 个 服务 
器 池 的 透明 部 署 ， 提 供 硬件 故障 或 计划 内 中 上 断 的 容错 。Oracle RAC 提 供 单 个 映像 安装 和 | 管理。 数据 库 管理 员 有 一 个 单一 的 控制 
点 ， 使 用 提供 的 图 形 用 户 界面 (GUI) 或 命令 行 工具 来 安装 和 管理 Oracle RAC 集 群 。 


Oracle RAC 消 除了 单个 服务 器 的 单 点 故障 。 如 果 服 务 器 池 中 一 个 节点 出 现 故障 ，Oracle 数 据 库 继 续 在 池 中 剩余 的 服务 器 上 
运行 。 个 别 服 务 器 可 以 进行 关闭 维修 ， 而 应 用 程序 用 户 可 以 继续 工作 。 


集群 系统 的 另 一 个 例子 是 1BM 的 Sysplex 多 处 理 器 线 ， 它 把 工作 分 挫 在 并 行 处 理 器 上 。 单 看 一 个 处 理 器 ， 其 远 不 及 传统 的 双 


极 处 理 器 功能 强大 ， 但 是 结合 后 ， 它 们 通过 将 工作 分 配给 开启 的 处 理 器 ， 处 理 数据 的 速度 更 快 ， 而 不 需要 用 户 等 待 打 开 一 个 处 理 
器 。 可 以 设置 用 于 z/OS 的 DB2 来 利用 这 种 类 型 的 并 行 处 理 。 “数据 共享 和 用 于 z/Os 的 DB2” 提供 了 更 多 细节 。 


请 记 住 ， 标 准 数据 库 维 护 软件 可 能 无 法 在 集群 和 并 行 系统 中 有 效 运行 。 为 了 降低 成 本 ， 提 高 可 用 性 ，DBA 使 用 的 工具 必须 
能 够 利用 正在 使 用 的 集群 和 并 行 技术 。 否 则 ， 这 些 产 品 的 运行 将 变 得 缓慢 ， 且 效率 低下 ， 因 为 它们 根据 不 同 的 硬件 环境 构建 ， 否 
认 了 并 行 技术 的 优势 。 例 如 ， 重 组 数据 库 与 处 理 备份 和 恢复 功能 (并行 处 理 环境 ) ，DBA 需 要 维护 专门 编写 实用 程序 来 利用 并 
行 处 理 器 。 
数据 共享 与 用 于 z/OS 的 DB2 
DB2 数 据 共 享 允 许 应 用 程序 在 多 个 DB2 子 系统 上 运行 ， 同 时 读 取 和 写 入 相同 的 数据 集 。 简 单 地 说 ， 数 据 共享 ,使 多 个 DB2 子 


系统 像 一 个 系统 。 


数据 共享 的 主要 好 处 是 提高 数据 的 可 用 性 。 有 了 数据 共享 ， 数 据 可 跨 多 个 DB2 子 系统 进行 直接 访问 。 此 外 ， 应 用 程序 可 以 运 


行 在 多 个 更 小 、 价 格 更 具 竞 争 力 的 基于 微 处 理 器 的 机 器 上 ， 从 而 提高 数据 的 可 用 性 和 性 能 /价格 比 。 


一 个 优点 是 容量 可 扩展 。 容 量 增加 ， 是 因为 有 更 多 的 处 理 器 执行 DB2 应 用 程序 。 不 同 于 单个 逻辑 分 区 上 的 单个 DB2 子 系统 ， 
多 个 中 央 处 理 器 配合 物 (CPC) 可 用 于 执行 一 个 程序 (甚至 单个 查询 ) 。 


DB2 数 据 共享 需要 一 台 IBM 的 Parallel Sysplex。IBM 的 Sysplex 是 一 组 z/OS (大 型 机 ) 映像 个， 通过 共享 一 个 或 多 个 Sysplex 定 时 
器 连接 和 耦合 在 一 起 。 并 行 Sysplex 是 一 种 基本 的 Sysplex， 额 外 共享 一 个 耦合 设施 。 耦 合 设施 提供 外 部 共享 存储 和 一 组 硬件 协议 ， 
允许 应 用 程序 和 子 系统 通过 使 用 外 部 共享 内 存 共享 数据 的 完整 性 。 并 行 Sysplex 通 过 扩展 能 力 ， 增 加 单个 z/OS 了 映像 内 的 处 理 器 的 
数量 ,使 多 个 z/OS 映像 能 够 共同 处 理 一 个 共享 的 工作 量 ， 从 而 增强 可 扩展 性 。 


对 于 非 大 型 机 平台 上 的 DB2，DB2 pureScale 架 构 类 似 于 用 于 z/OS 的 DB2 的 数据 共享 。IBM 创 建 了 基于 大 型 机 数据 共享 概念 的 
pureScale 架 构 ， 与 最 新 的 分 布 式 技术 集成 在 一 起 ， 提 供 分 布 式 平台 的 可 用 性 和 延展 性 服务 。 


[1] 这 种 类 型 的 集群 指 的 是 硬件 ， 与 第 4 章 讨论 的 集群 (磁盘 中 数据 的 组 织 ) 不 同 。 
[2] 称 作 LPAR ( 远 辑 PARtitions) o 


8.4.5 ”数据 库 架 构 和 NoSQL 


对 于 某 些 数据 密集 型 应 用 程序 (如 索引 大 量 的 文件 ， 高 流量 网 站 的 服务 网 页 ， 以 及 提供 流 媒 体 ) ， 传 统 的 关系 数据 库 系统 可 
能 不 是 提供 高 可 用 性 和 性 能 的 最 佳 选择 。 在 这 种 情况 下 ，NoSQL 数 据 库 系统 的 设计 很 适合 与 “大 数据 ”应 用 联系 在 一 起 。 


虽然 NoSQL 比 较 普及 ,但 NoSQL 数 据 库 系 统 以 及 它 必须 能 够 做 什么 ， 并 没有 完全 严格 的 定义 。 在 高 层次 上 ，NoSQL 意 味 着 
非 关 系 型 的 、 分 布 式 的 、 灵 活 的 和 可 扩展 的 。 许 多 NoSQL 数 据 库 产品 还 是 开源 的 。NoSQL 数 据 库 系 统 的 共同 属性 包括 缺乏 架 
构 、 使 用 简单 、 支 持 复制 以 及 “最 终 一 致 ”的 能 力 (不 是 典型 的 ACID 事 务 能 力 ) 。 


NoSQL 数 据 库 在 现实 世界 中 已 经 部 署 在 Digg (3TB 的 实施 绿色 徽章 ) 和 Facebook 上 (50TB 实 施 收 件 箱 搜索 ) 。Twitter 也 
使 用 NoSQL， 从 最 初 的 MySQL 基 础 移动 到 基于 Java 的 NoSQL Cassandra DBMS, 


8.5 We 


企业 必须 为 24/7 运 行 时 间 和 定期 维护 这 样 看 似 不 相 容 的 需求 找到 一 个 平衡 点 。 维 护 不 善 的 数据 库 会 阻碍 业务 的 进行 ， 从 危 
机 事件 中 恢复 几乎 是 不 可 能 的 。 本 地 数据 库 实用 程序 的 替代 品 ， 可 以 提供 维护 和 备份 功能 ， 同 时 提供 持续 可 用 性 的 数据 库 及 其 相 
关 应 用 程序 。 在 许多 情况 下 ， 关 键 应 用 程序 直接 影响 收入 。 因 此 ，DBA 必 须 实施 一 种 维护 和 备份 策略 ， 来 提供 最 佳 的 可 用 性 。 


此 外 ，DBA 必 须 对 可 能 会 导致 缺乏 可 用 性 的 潜在 问题 保持 警惕 。 这 些 问 题 包 括 硬件 问题 、 软 件 缺陷 和 人 为 错误 。 显 然 ， 每 
种 类 型 的 数据 库 不 可 用 对 企业 结构 、 用 户 和 DBA 的 影响 各 不 相同 。 虽 然 都 涉及 中 断 ， 从 终端 用 户 的 角度 看 ， 有 些 是 DBA 比 较 容 
易 解决 的 。 无 论 如 何 ，DBA 必 须 准备 好 解决 任何 类 型 的 可 用 性 问题 ， 因 为 它们 影响 了 数据 库 用 户 访问 和 修改 数据 的 能 力 。 这 是 
一 项 复杂 上 且 具有 挑战 的 任务 ， 因 为 其 范围 是 整个 企业 (正如 IT 基础 架构 的 每 一 个 组 件 都 可 以 影响 数据 库 的 可 用 性 一 样 ) 。 


对 可 能 会 导致 缺乏 可 用 性 的 潜在 问题 保持 警惕 。 


但 是 ， 如 果 DBA 有 具备 一 定 的 技能 ， 并 接受 过 适当 的 培训 ， 审 慎 的 DBA 规 范 和 24/7 的 可 用 性 不 需要 相互 排斥 。 只 需要 合适 的 


8.6 ”回顾 


1. 请 给 出 可 用 性 的 定义 。 

2. 比 较 性 能 问题 和 可 用 性 问题 。 

3. 请 说 出 三 种 类 型 的 技术 ， 可 以 帮助 减轻 可 用 性 问题 。 

4. 硬 件 和 软件 故障 是 数据 不 可 用 的 唯一 原因 ， 这 种 说 法 正确 与 否 ? 

5. 损 坏 和 无 效 的 数据 对 可 用 性 会 产生 什么 影响 ? 

6. 哪 些 因 素 会 导致 停机 成 本 ? 

7. 计 划 外 中 断 的 典型 原因 是 什么 ? 

8. 由 计划 内 中 断 造 成 的 停机 比例 是 多 少 ? 

9. 什 么 是 不 间断 的 数据 库 实用 程序 ?它们 对 维护 数据 库 的 可 用 性 为 何如 此 重要 ? 


10. 可 以 采取 哪 四 个 (高层 次) 步骤 来 提高 数据 库 的 可 用 性 ? 
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第 9 草 ”性 能 管理 


通常 ， 外 行人 会 认为 DBA 的 任务 就 是 性 能 监控 和 调整 。 这 不 足 为 奇 。 几 乎 每 个 接触 计算 机 的 人 都 遇 到 过 这 样 或 那样 的 性 能 
问题 。 另 外 ， 关 系数 据 库 系 统 的 性 能 一 直 都 不 受 人 称道 (大 多 都 不 应 得 ) 。 


本 章 以 及 接 下 来 的 3 章 ， 将 讨论 数据 库 管理 范围 内 的 性 能 监控 、 调 整 和 管理 。 本 章 定义 性 能 ， 讨 论 性 能 监控 和 性 能 管理 之 间 
的 差异 ， 着 眼 于 管理 服务 水 平 ， 并 定义 数据 库 性 能 管理 的 三 种 具体 的 子 集 。 第 10~ 第 12 章 深入 探讨 三 个 子 集 。 


大 多 数 企 业 都 会 监测 和 调整 它们 的 I!T 基 础 设施 的 性 能 。 这 个 基础 设施 包括 服务 器 、 网 络 、 应 用 程序 、 台 式 机 和 数据 库 。 然 
而 ， 性 能 管理 采取 的 步骤 通常 是 被 动 反应 。 用 户 调用 遇 到 了 响应 时 间 的 问题 ; 表 空 间 耗 尽 了 磁盘 人 存储 空间 ， 空 间 需要 扩大 ; 处 理 
不 完 的 批 处 理 窗 口 ; 有 人 提交 了 一 个 永远 都 不 会 停 的 “来 自 地 狱 的 查询 ”。 这 些 都 是 与 你 相关 的 ， 需 要 你 一 个 一 个 地 解决 。 


性 能 管理 通常 是 被 动 反应 。 


处 理性 能 问题 ， 是 一 个 企业 真正 需要 努力 的 事情 。 然 而 ,企业 性 能 管理 任务 经 常 是 DBA 组 的 工作 。 做 过 DBA 的 人 (不论 时 
间 长 短 ) 都 知道 ，DBM 通常 是 “被 证 明 无 齐 之 前 都 是 有 罪 的 ”。 不 管 是 什么 原因 ， 每 一 个 性 能 问题 都 归咎 于 数据 库 问 题 。DBA 
需要 能 够 研究 并 确定 所 有 性 能 下 降 问 题 的 真正 原因 ， 只 为 了 证 明 不 是 数据 库 的 问题 。 因 此 ，DBA 必 须 至 少 了 解 整个 IT 基础 设施 的 
基本 原理 ， 还 需要 很 多 其 他 相关 领域 的 专家 (如 网 络 、 操 作 系统 和 通信 协议 ) 。DBA 需 要 全 面 了 解 上 T 基 础 设施 ， 在 出 现 性 能 问题 


时 才能 够 有 效应 对 。 市 面 上 有 一 些 事件 驱 动 的 工具 ， 当 触发 特定 警报 时 ， 会 自动 调用 预定 义 的 动作 ， 从 而 使 性 能 管理 更 加 容易 。 
例如 ， 可 以 设置 警报 ， 在 数据 库 到 达 其 仓储 容量 时 ， 积 极 重组 数据 库 ， 或 DBM 达到 极限 时 ， 分 配 更 多 的 内 存 。 还 有 一 些 工 具 可 
以 减轻 性 能 管理 和 分 析 的 负担 。 然 而 ， 针 对 生产 中 已 经 完成 的 应 用 程序 采取 的 许多 所 谓 积 极 的 步骤 ， 事 实 上 大 多 也 是 被 动 的。 这 
是 可 以 理解 的 ，DBA 经 常 忙于 日 常 策略 上 的 数据 管理 库 任 务 ， 以 至 于 不 能 对 系统 进行 主动 监测 并 将 其 调整 到 满意 的 程度 。 


处 理性 能 问题 ， 是 一 个 企业 真正 需要 努力 的 事情 。 


所 有 这 些 讨论 都 是 有 用 的 ， 但 它 引出 了 一 个 问题 : 数据 库 性 能 到 底 是 什么 ”你 需要 严格 的 数据 库 性 能 的 定义 ， 然 后 才能 为 效 
率 做 一 些 规划 。 不 妨 用 供给 和 需求 的 概念 来 想 一 想 数据 库 性 能 。 用 户 请 求 数据 库 的 信息 ，DBMS 提 供 信息 满足 这 些 请 求 。DBMS 
提供 信息 需求 的 速度 可 以 称 为 数据 库 性 能 。 然 而 ， 这 个 定义 仅 以 最 简单 的 形式 说 明了 数据 库 性 能 的 定义 。 


我 们 需要 一 个 更 全 面 的 数据 库 性 能 定义 。 影 响 数 据 库 性 能 的 五 大 因素 : 工作 量 、 吞 吐 量 、 资 源 、 优 化 和 争 用 。 


工作 量 是 在 线 事 务 、 批 处 理 作 业 、 临 时 查询 、 数 据 仓库 分 析 和 系统 命令 的 组 合 ， 在 任何 给 定 的 时 间 直 接 通 过 系统 。 工 作 量 可 
以 每 天 、 每 小 时 ， 甚 至 每 一 分 钟 都 大 幅 波 动 。 工 作 量 有 时 是 可 以 预测 的 (如 月 底 工资 处 理 的 大 量 访问 ,或 下 午 7: 00 后 访问 量 很 
少 ， 因 为 大 多 数 用 户 已 经 下 班 ) ， 而 其 他 时 间 的 工作 量 则 难以 预测 。 总 体 工作 量 会 对 数据 库 性 能 产生 重大 影响 。 


吞吐 量 定义 计算 机 处 理 数据 的 整体 能 力 。 由 |/O 速 度 、CPU 速 度 、 机 器 的 并 行 能 力 、 操 作 系统 和 系统 软件 的 效率 组 成 。 随 意 
使 用 系统 的 硬件 和 软件 工具 ， 称 为 系统 资源 。 资 源 包括 数据 库 内 核 、 磁 盘存 储 设备 、 随 机 访问 存储 器 芯片 、 高 速 缓 存 控 制 器 和 微 
码 。 


数据 库 性 能 的 第 四 个 定义 元 素 是 优化 。 所 有 类 型 的 系统 都 可 以 进行 优化 ， 但 关系 数据 库 是 唯一 一 个 ， 查 询 优化 主要 在 DBMS 
内 部 完成 。 然 而 ， 还 需要 对 一 些 其 他 的 因素 进行 优化 (如 SQL 的 制订 和 数据 库 参 数 ) ， 使 数据 库 优化 程序 能 够 创建 最 有 效 的 访问 
路 径 。 

当 特 定 资源 的 需求 (工作 量 ) 高 时 ， 可 能 会 导致 争 用 。 争 用 产生 的 条 件 是 两 种 或 多 种 工作 量 试图 以 冲突 的 方法 使 用 一 种 单一 
的 资源 (例如 ， 对 相同 数据 的 双重 更 新 ) 。 争 用 增加 ， 吞 吐 量 就 会 下 降 。 

因此 ， 数 据 库 性 能 可 以 定义 为 优化 资源 的 利用 ， 提 高 吞吐 量 并 最 小 化 争 用 ， 使 可 以 处 理 的 工作 量 达到 最 大 值 。 当 然 ， 我 不 主 
张 凭空 管理 数据 库 性 能 。 应 用 程序 应 该 与 |T 基 础 设施 的 其 他 子 系统 以 及 组 件 定期 沟通 。 这 些 也 必须 考虑 到 企业 的 整体 性 能 规划 
中 。 但 是 ， 明 智 的 做 法 是 限制 DBA 在 此 定义 范围 以 外 的 性 能 调整 的 实际 责任 。 如 果 某 项 任务 不 包括 在 上 面 的 定义 中 ， 它 可 能 需 
要 用 到 数据 库 管 理 以 外 的 专门 知识 。 因 此 定义 中 没有 包含 的 性 能 管理 任务 应 该 由 其 他 人 ， 而 不 是 DBA 来 处 理 ， 或 者 DBA 和 其 他 
技术 人 员 共 同 处 理 。 


数据 库 性 能 可 以 定义 为 优化 资源 的 利用 ， 提 高 吞吐 量 并 最 小 化 争 用 ， 使 可 以 处 理 的 工作 量 达 到 最 大 值 。 


基本 的 数据 库 性 能 线路 图 


规划 数据 库 性 能 管理 是 任何 应 用 程序 实现 的 一 个 重要 组 成 部 分 。 因 此 ，DBA 需 要 开拓 一 个 基本 的 计划 ， 确 保 完成 整个 企业 
所 有 数据 库 应 用 程序 的 数据 库 性 能 管理 和 分 析 。 完 整 的 性 能 管理 计划 将 包括 一 些 工具 ， 这 些 工 具有 助 于 监测 应 用 程序 性 能 、 调 整 
数据 库 和 SQL。 


根据 80/20 规 则 ( 见 “80/20 法 则 ”) ， 第 一 步 应 该 是 确定 最 麻烦 的 地 方 。 然 而 ， 这 并 不 像 说 起 来 那么 容易 。 


大 多 数 数 据 库 应 用 程序 性 能 问题 的 罪魁 祸首 是 效率 低下 的 SQL 和 应 用 程序 代码 。 以 我 的 经 验 ，75%~80% 的 数据 库 性 能 问题 
可 以 追溯 到 编码 糟糕 的 SQL 或 应 用 程序 逻辑 。 这 并 不 意味 着 应 用 程序 中 的 SQL 一 开始 就 不 好 。 当 应 用 程序 首次 移 到 生产 环境 中 


时 ， 昌 然 会 对 它 进行 全 面 的 调整 ， 使 其 能 够 快速 访问 关系 数据 库 ， 随 着 时 间 的 推移 ， 性 能 可 能 会 下 降 。 这 种 下 降 的 原因 有 很 多 ， 
如 数据 库 的 增长 、 新 的 数据 访问 模式 、 额 外 的 用 户 、 业 务 的 变更 等 。 


大 多 数 数 据 库 应 用 性 能 问题 的 罪魁 祸首 是 效率 低下 的 SQL 和 应 用 程序 代码 。 
80/20 法 则 


80/20 法 则 ， 也 称 为 帕 雷 托 原则 ， 是 一 个 古老 的 格言 ， 说 明 80% 的 业绩 来 自 20% 的 努力 。 这 个 法 则 通常 适用 于 大 多 数 的 工 
作 。 无 论 百分比 是 否 是 精确 的 80% 和 20%， 法 则 的 基本 逻辑 是 ， 少 许 的 努力 带 来 最 大 的 回报 。 


i 


如， 适用 于 数据 库 性 能 调整 的 帕 雷 托 法 则 ， 可 以 说 80% 的 性 能 调整 来 自 20% 的 努力 。 此 外 ， 它 可 以 很 容易 地 应 用 到 数据 库 
应 用 程序 中 ，20% 的 数据 库 应 用 程序 会 导致 80% 的 问题 。 


底线 是 ， 从 数据 库 性 能 调整 的 角度 来 看 ， 聪 明 的 DBA 将 首先 集中 在 最 可 能 引起 性 能 问题 的 原因 ， 因 为 这 样 可 以 得 到 调整 投 
资 的 高 回报 。 


当然 ，SQL 和 应 用 程序 代码 也 可 以 一 开始 就 不 太 好 。 任 何 问题 都 可 能 会 导致 SQL 的 性 能 低下 ， 包 括 
- 表 扫 描 ; 
. 缺乏 适当 的 索引 ; 
- 索引 选择 不 当 ; 
- 没有 使 用 可 用 的 索引 ; 
“ 过 期 的 数据 库 统计 信息 ， 
“ 表 连 接 的 顺序 不 是 最 优 的 ; 
- 应 用 程序 连接 ， 而 不 是 通常 更 有 效 的 SQL 连接 ; 
DERRER (EMR. Silay) ; 
:高效 的 SQL 放 在 低 效 的 应 用 程序 代码 中 《循环 ) ， 
* 制定 低 效 的 子 查询 〈 存 在 、 不 存在 等 ) ; 
. 不 必要 的 排序 (distinct. group bys order by, union) o 
在 大 型 公司 内 查找 最 消耗 资源 的 SQL 语句 是 件 非常 困难 的 事情 。 [占用 资源 的 SQL 语 句 可 能 隐藏 在 几 百 甚至 上 干 的 程序 


中 。 产 生动 态 、 临 时 SQL 语句 的 交互 式 用 户 可 能 驻 留 在 任何 地 方 。 产 生 临 时 查询 的 任何 一 个 人 ， 都 可 能 会 严重 影响 整体 的 生产 性 


ab 
AGo 


一 个 不 错 的 方法 是 使 用 SQL 监视 器 确定 在 环境 中 运行 的 所 有 SQL。 通 常情 况 下 ， 这 些 工 具 根据 消耗 的 资源 量 对 SQL 语句 进行 
排名 ， 并 跟踪 语句 找到 发 出 语句 的 用 户 和 程序 。 一 旦 确定 了 最 消耗 资源 的 语句 ， 就 可 以 集中 精力 调整 这 些 语 句 。 


然而 ， 调 整编 码 糟 糕 的 SQL 语句 并 不 容易 。 合 理 编码 和 优化 SQL 语句 需要 细致 和 努力 。 第 12 章 深入 介绍 了 SQL 调整 策略 和 额 
外 的 应 用 程序 性 能 管理 细节 。 


合理 编码 和 优化 SQL 语句 需 要 细致 和 努力 。 


当然 ， 其 他 因素 也 可 以 对 数据 库 性 能 造成 负面 影响 。 明 智 的 做 法 是 对 数据 库 实 例 和 服务 器 操作 系统 的 整体 性 能 进行 定期 检 
查 。 一 些 快速 的 检查 内 容 包括 : 


“ 内 存 分 配 (缓冲 区 /高 速 缓存 数据 、SQL、 授 权 ) ; 
- 日志 选项 (日 志高 速 缓存 、 日 志 大 小 、Otacle 回 滚 段 ) ; 


. I/O 效 率 〈 磁 盘 上 表 和 索引 的 分 离 、 数 据 库 的 大 小 、 零 碎 和 扩展 的 文件 ) ; 


+ 应 用 程序 和 数据 库 服务 器 上 的 整体 工作 量 ; 
. 数据 库 模式 定义 。 
为 了 保证 最 佳 的 数据 库 性 能 ， 可 以 计划 将 数据 库 性 能 的 定义 与 公司 详细 的 性 能 计划 结合 在 一 起 。 


D 进行 大 量 的 设计 审查 〈 如 第 6 章 所 讨论 的 ) ， 有 助 于 在 不 好 的 SQL 应 用 到 生产 系统 之 前 将 它们 揪 出 来 。 


9.2 ”监测 与 管理 


遗憾 的 是 ，DBA 通 常会 被 动 地 调整 性 能 。 用 户 调用 遇 到 了 响应 时 间 的 问题 ;数据库 耗 尽 了 所 有 的 空间 ; 处 理 不 完 的 批 处 理 
窗口 。 问 题 已 经 发 生 了 ， 再 去 补救 。 这 纯粹 是 被 动 反应 。 

对 已 经 完成 的 生产 应 用 程序 采取 的 许多 所 谓 的 积极 步骤 ， 也 可 以 视 为 被 动 反 应 。 要 求 重 写 已 经 完成 的 应 用 程序 的 代码 不 是 一 
种 主动 行为 。 因 为 在 完成 应 用 程序 之 前 ， 有 机 会 纠正 问题 。 

一 些 事件 驱动 的 工具 ， 在 预先 设 定 的 警报 触发 时 自动 采取 预定 义 的 动作 ， 使 性 能 调整 更 容易 。 这 是 性 能 管理 的 第 一 步 。 管 理 
性 能 不 同 于 监测 性 能 ， 因 为 性 能 检测 在 出 现 问题 时 有 详细 的 计划 解决 问题 。 

性 能 管理 包含 三 个 特定 步骤 ， 需 要 互相 配合 : 监测 、 分 析 和 更 正 ， 见 图 9-1。 监 浏 是 性 能 管理 的 第 一 个 步骤 。 它 包含 扫描 环 
境 、 审 查 仪器 设备 的 输出 和 系统 运行 时 查看 系统 。 监 测 是 发 现 问题 的 过 程 。 
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图 9-1 性 
性 能 管理 包含 三 个 步骤 : 监测 、 分 析 和 更 正 。 


分 析 是 性 能 管理 的 第 二 个 步骤 。 一 个 监测 任务 可 以 生成 数 百 或 数 干 消息 或 大 量 的 纸 质 报告 。 监 测 程序 可 以 收集 相关 信息 进行 
性 能 调整 和 优化 决策 ， 但 本 质 上 是 不 明智 的 。 监 测 程序 不 能 根据 已 收集 的 信息 独立 进行 决策 。 这 需要 分 析 ， 分 析 通 常 由 技术 熟练 
的 技术 人 员 如 DBA 执 行 。 


优化 一 一 更 正 措施 一 一 是 性 能 管理 的 第 三 个 步骤 。 一 些 性 能 工具 使 技术 人 员 能 够 将 性 能 管理 的 某 些 方面 实现 自动 化 ， 在 监 
测 代理 确定 某 种 情况 时 ， 可 以 自动 执行 纠正 。 但 是 ， 大 多 数 这 些 工具 的 学 围 都 受到 限制 。 此 外 ， 熟 练 的 技术 人 员 必 须 先 搭建 自动 
化 环境 ， 确 保 在 正确 的 时 间 采 取 适 当 的 优化 步骤 。 最 终 ， 性 能 管理 工具 和 解决 方案 会 变 得 很 智能 ， 植 入 如 何 优化 DBM 的 知识 并 
知道 如 何 做 可 以 让 调整 的 效果 最 好 。 


只 要 有 积极 的 性 能 计划 ， 就 可 以 实现 性 能 管理 。 发 生 紧急 情况 之 前 ， 很 多 问题 都 可 以 提前 识别 ， 解 决 方案 也 可 以 映射 。 计 划 
使 纠正 性 能 问题 变 得 更 简单 ， 事 实 上 ， 一 些 性 能 问题 完全 可 以 避免 ， 因 为 在 问题 发 生前 ， 可 以 先 纠 正 造 成 这 一 问题 的 情况 。 


只 要 有 积极 的 性 能 计划 ， 就 可 以 实现 性 能 管理 。 


要 实现 真正 的 主动 性 能 管理 ，DBA 必 须 事先 计划 应 用 程序 的 性 能 。 这 就 要 求 DBA 参 与 到 应 用 程序 的 开发 过 程 ， 并 确保 应 用 
程序 的 设计 考虑 了 性 能 这 一 因素 。DBA 高 度 参 与 应 用 程序 的 开发 过 程 可 能 不 现实 。 因 为 DBA 的 时 间 很 紧 ， 一 般 不 允许 他 们 第 一 
次 就 将 事情 做 到 位 。 


9.2.1 被动 与 主动 


被 动 性 能 管理 已 会 用 到 ， 因 为 总 会 有 意 想 不 到 的 性 能 问题 发 生 。 不 可 能 预见 所 有 的 性 能 问题 ， 毕 竟 ， 系 统 和 应 用 程序 都 在 改 
变 。 被 动 性 能 管理 ， 其 本 身 并 不 是 一 件 坏事 ， 但 执行 的 过 程 非常 耗 时 ， 而 且 是 手动 执行 。 主动 性 能 管理 往往 与 事先 考虑 、 规 划 和 
自动 化 结合 在 一 起 ， 可 以 减少 被 动 反应 监测 和 调整 。 换 句 话说， 主动 性 能 管理 可 以 减少 大 量 的 时 间 、 精 力 ， 以 及 在 实施 和 维护 有 
效 的 数据 库 系 统 中 涉及 的 人 为 错误 。 


主动 性 能 管理 往往 与 事先 考虑 、 规 划 和 自动 化 结合 在 一 起 ， 可 以 减少 被 动 反应 监测 和 调整 。 


虽然 主动 性 能 管理 比 被 动 反 应 具有 更 大 的 投资 回报 ， 但 是 许多 DBA 企 业 仍 在 犹豫 是 否 实施 主动 解决 性 能 问题 的 计划 。 大 多 
数 情况 下 ， 这 是 因为 DBA 被 动 反应 性 能 的 工作 负担 过 重 。 事 实 上 ， 如 果 老 板 盯 着 ,手机 不 断 响 着 ,开发 人 员 在 办 公 室 门 外 排队 
等 候 着 ， 这 种 情况 下 期 望 DBA 积 极 寻 求 额 外 的 工作 实在 不 太 合理 。 


但 是 请 记 住 ， 适 当 的 主动 性 能 管理 办 法 可 以 避免 许多 需要 反应 关注 的 问题 。 


9.2.2 ”生产 前 的 性 能 评估 


在 理想 的 情况 下 ，DBA 和 开发 人 员 应 该 实施 一 套 方法 ， 将 高 性 能 加 入 应 用 程序 的 设计 和 构建 过 程 。 这 套 方法 必须 解决 
ADLC, 包括 引入 策略 在 创建 数据 库 和 应 用 程序 代码 的 同时 实现 高 性 能 。 严 格 、 重 点 核查 结果 的 过 程 ， 将 性 能 构建 到 应 用 程序 和 
数据 库 中 ， 从 而 消除 费时 费力 的 重新 设计 和 重新 编码 工作 (至 少 对 于 大 多 数 性 能 问题 是 这 样 ) 。 


在 ADLC 中 发 现 的 早 的 问题 比 在 应 用 程序 中 确定 的 晚 的 问题 更 容易 修复 且 成 本 更 少 ， 如 图 9-2 所 示 。 主 动 性 能 管理 可 以 减少 
应 用 程序 的 开发 成 本 ， 因 为 它 发 生 在 应 用 程序 投入 生产 环境 之 前 。 在 应 用 程序 真正 运行 后 再 更 正 问题 ， 是 成 本 最 高 的 性 能 管理 方 
法 ， 因 为 用 户 需要 操作 这 些 应 用 程序 来 完成 他 们 的 工作 。 如 果 生 产 环境 中 的 应 用 程序 有 性 能 问题 ， 会 使 执行 关键 任务 时 间 大 量 增 
加 (关键 工作 ， 如 客户 服务 ) 。 此 外 ， 正 如 在 前 面 的 章节 中 讨论 的 ， 严 重 的 性 能 问题 可 能 会 导致 中 断 。 
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图 9-2 应 用 程序 开发 生命 周期 各 阶段 的 性 能 问题 的 成 本 


评估 应 用 程序 的 性 能 不 同 于 分 析 和 优化 单一 的 数据 库 查询 。 性 能 的 建 模 应 该 针对 整个 应 用 程序 ， 因 为 个 别 查 询 优化 可 能 以 牺 
牲 其 他 查询 为 代价 。 模 型 可 以 显示 所 有 查询 的 整体 影响 ， 以 及 它们 如 何 影响 彼此 的 性 能 。 这 种 模型 使 DBA 能 够 优化 整体 性 能 。 


性 能 的 建 模 应 该 针对 整个 应 用 程序 。 


创建 准确 的 性 能 模型 是 一 个 反复 的 过 程 。 必 须 对 每 个 变更 进行 审查 和 更 新 ， 并 衡量 其 对 有 效 性 的 影响 。DBA、SAS、 应 用 程 
序 开发 人 员 和 容量 规划 员 必 须 一 起 合作 ， 共 享 信息 并 处 理 可 能 会 影响 性 能 标准 的 任何 业务 需求 问题 。 


9.2.3 ”历史 趋势 


捕获 和 分 析 资 源 的 使 用 趋势 和 性 能 统计 信息 ， 是 另 一 种 有 价值 的 性 能 任务 。 历 史 性 能 和 资源 趋势 使 得 DBA 可 以 提前 几 周 ， 
也 许 几 个 月 预测 硬件 升级 的 需要 。 管 理 员 可 以 跟踪 关键 性 能 统计 信息 (如 缓冲 区 的 命中 率 、 文 件 /O 和 日 志 开 关 ) 并 将 这 些 信息 
存储 到 数据 库 的 跟踪 表 中 。 这 提供 了 可 以 报道 和 分 析 的 珍贵 历史 信息 。DBA 可 以 跟踪 性 能 和 资源 消耗 ， 并 预测 随 着 使 用 的 增 
加 ， 硬 件 资源 什么 时 候 消耗 。 此 外 ， 由 于 数据 库 增 加 了 用 户 活动 ， 从 历史 趋势 可 以 看 出 ， 哪 些 阶段 的 性 能 比 平时 慢 。 上 例如， 
数据 库 应 用 程序 往往 由 于 月 底 处 理 要 求 过 多 ， 每 月 前 三 天 的 运行 速度 较 慢 。 当 DBA 试 图 去 理解 他 们 的 应 用 程序 、 数 据 库 和 系统 
的 性 能 特点 时 ,一 直 维 护 的 关键 历史 性 能 指标 可 以 给 DBA 带 来 巨大 的 好 处 。 


维护 关键 历史 性 能 指标 可 以 给 DBA 带 来 巨大 的 好 处 。 


站 如 果 你 不 知道 什么 是 正常 的 ， 你 如 何 知道 什么 是 不 正常 的 ? 


9.3 ”服务 级 别管 理 


服务 级 别管 理 (SLM) 是 用 “规律 、 积 极 主动 的 方法 和 程序 ， 按 照 业务 优先 级 和 可 接受 的 成 本 ， 确 保 为 所 有 IT 用 户 提供 足够 
的 服务 水 平 ”。 [为 了 有 效 地 管理 服务 级 别 ， 企 业 必须 为 应 用 程序 制定 优先 级 ， 并 确定 为 这 些 应 用 程序 提供 服务 所 需 花费 的 时 
间 、 精 力 和 资金 。 


服务 级 别 是 对 运营 行为 的 一 种 衡量 。 基 于 资源 对 企业 的 重要 性 将 它们 应 用 到 应 用 程序 中 ，SLM 确 保 应 用 程序 能 够 正常 运 
行 。 SLM 根 据 企业 的 需要 ， 可 以 专注 于 可 用 性 、 性 能 ,或 两 者 兼 而 有 之 。 在 可 用 性 方面 ， 服 务 级 别 可 能 会 定义 为 “99.95% 的 正 
常 运行 时 间 ， 工 作 日 从 上 午 9: 00 至 晚上 10: 00”。 当 然 ， 服 务 级 别 可 以 更 具体 ， 指 出 “500 个 或 更 少 的 用 户 工作 负载 ， 事 务 的 
平均 响应 时 间 是 2 秒 或 更 短 ”。 


SLM 确 保 基 于 资源 对 企业 的 重要 性 ， 将 其 应 用 到 应 用 程序 中 。 


SLA 要 想 成 功 ， 所 有 参与 的 各 方 必须 对 可 用 性 和 性 能 的 既定 目标 达成 一 致 。 终 端 用 户 必须 对 他 们 的 应 用 程序 的 性 能 感到 满 
意 ，DBA 和 技术 人 员 必 须 对 他 们 所 管理 的 系统 达到 目标 的 能 力 感到 满意 。 有 协 ， 才 能 达到 有 用 的 SLA。 


但 在 实践 中 ， 许 多 企业 没有 将 SLM 实 现 制度 化 。 交 付 新 的 应 用 程序 时 ， 可 能 有 比较 模糊 的 亚 秒 级 响应 时 间 的 要 求 和 承诺 ， 
但 很 少 涉及 如 何 确 保 这 种 服务 级 别 的 优先 顺序 和 预算 要 求 ， 除 非 IT 部 门 外 包 。 内 部 IT 组 织 都 不 愿意 签署 SLA， 因 为 任何 值得 追求 
的 SLA 都 非常 难以 实现 。 此 外 ， 一 旦 SLA 协 商 很 难 达 成 一 致 ， 企 业 很 可 能 会 掉头 并 将 SLA 外 包 给 低 成 本 的 供应 商 ， 而 不 是 内 部 IT 


但 不 要 误会 。 大 多 数 业 务 SLM 的 失败 在 于 IT 企业 和 企业 用 户 两 者 。 企 业 用 户 经 常 渴望 更 好 的 服务 ， 但 不 愿意 正确 优先 处 理 他 


们 的 需求 或 支付 额外 的 费用 ， 以 达到 更 好 的 服务 。 
SLM 的 另 一 个 潜在 的 问题 是 上 文中 讨论 的 服务 。 大 多 数 |T 专 业 人 员 在 元 素 的 基础 上 看 待 服务 级 别 。 换 言 之 ，DBA 基 于 DBMS 
SLM 正 确 看 待 整个 应 用 程序 的 服务 。 但 是 ， 在 典型 的 IT 结构 内 分 配 职 


看 待 性 能 ，SA 基 于 操作 系统 或 事务 处 理 系统 看 待 性 能 等 。 
责 很 困难 。IT 的 运作 通常 可 以 视 为 一 组 合作 不 是 很 好 的 简 仓 。 通 常情 况 下 ， 应 用 程序 团队 独立 于 DBA，DBA 独 立 于 SAs， 如 图 9- 


3 所 示 。 如 果 为 应 用 程序 团队 分 配 了 应 用 程序 DBA 的 工作 ， 这 个 团队 可 能 无 法 与 企业 的 DBA 简 仓 进行 有 效 的 沟通 。 由 于 这 些 充满 


裂 阶 的 简 仓 ， 要 想 达 成 共同 的 应 用 程序 服务 级 别 很 难 。 
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图 9-3 ”充满 裂隙 环境 的 I 芽 简 仓 
为 了 实现 终端 到 终端 的 SLM， 需 要 打破 这 些 简 仓 。|T 基 础 设施 内 各 部 门 需要 进行 有 效 的 沟通 ， 彼 此 合作 。 如 果 做 不 到 这 一 


点 ， 终 端 到 终端 的 SLM 很 难 实现 。 

SLM 是 一 种 有 益 的 做 法 : 强大 的 SLM 纪 律 ， 使 性 能 管理 成 为 可 能 。SLM 可 以 管理 涉及 的 所 有 期 望 。 如 果 没 有 SLA，DBA 和 终 
端 用 户 怎 么 知道 应 用 程序 执行 是 否 充 分 ? 不 是 每 一 个 应 用 程序 可 以 (或 者 需要 ) 提供 亚 秒 级 的 响应 时 间 。 如 果 没 有 SLA， 企 业 用 
户 和 DBA 可 能 有 不 同 的 期 望 ， 导 臻 企业 高 管 和 DBA 都 不 满意 


强大 的 SLM 纪 律 ， 使 性 能 管理 成 为 可 能 。 
有 了 SLM，DBA 可 以 将 它们 运用 到 SLA 定 义 的 最 关键 任务 的 应 用 程序 中 ， 来 调整 资源 。 控 制 成 本 并 将 资本 应 用 到 最 重要 业务 


相 相 
o IONOS 


中 。 没 有 SLM ， 就 无 从 知道 什么 是 可 接受 的 性 能 环境 
量 最 初 声称 的 性 能 ， 或 在 合理 预算 内 评估 改进 性 能 的 可 能 


[1] Rick Sturm, Wayne Morris 和 Mary Jander, 


看 ,没有 SLA， 如 果 终 端 用 户 向 DBA 抱 怨 性 能 不 佳 ， 就 没有 办 法 来 衡 


«Foundations of Service Level Management» (Indianapolis, IN: SAMS 出 版 社 ，2000 


年 ) 。 


9.4 性 能 调 优 的 类 型 


为 了 有 效 并 按照 规范 操作 数据 库 应 用 程序 ， 它 需要 不 同 计算 资源 之 间 的 不 断 互 动 。 但 事实 上 ， 数 据 库 应 用 程序 调 优 可 以 分 解 
成 三 个 部 分 组 成 : 系统 调 优 、 数 据 库 调 优 和 应 用 程序 调 优 。 事 实 上 ， 所 有 这 些 都 是 相互 关联 的 ， 某 些 方面 的 调 优 需要 用 到 一 种 集 
成 的 方法 。 然 而 ， 为 了 更 加 清楚 ， 下 面 将 分 开 讨 论 这 些 区 域 。 


9.4.1 系统 调 优 
系统 调 优 发 生 在 最 高 级 别 ， 对 数据 库 应 用 程序 的 整体 情况 影响 最 大 ， 因 为 每 个 应 用 程序 都 依赖 系统 。 为 了 方便 ， 定 义 系统 为 
包括 DBMS 本 身 及 其 依赖 的 所 有 相关 组 件 。 如 果 系统 所 在 的 服务 器 缺乏 某 些 资 源 或 安装 不 当 ， 调 优 也 无 济 于 事 。 


可 以 且 必 须 对 DBMS 进 行 调整 ， 保 证 最 佳 的 性 能 。DBMS 软 件 安 装 的 方式 、 其 内 存 、 硬 盘 、CPU、 其 他 资源 和 任何 配置 选项 
都 可 以 影响 数据 库 应 用 程序 的 性 能 。 


可 以 且 必 须 对 DBMS 进 行 调整 ， 保 证 最 佳 的 性 能 。 


与 DBMS 交 互 的 其 他 系统 软件 包括 操作 系统 、 网 络 软件 、 信 息 队列 系统 、 中 间 件 、 事 务 处 理 。 系 统 调 优 包括 安装 、 配 置 和 集 
成 问题 ， 以 及 确保 软件 与 DBMS 和 数据 库 应 用 程序 的 连接 。 


9.4.2 数据库 调 优 


性 能 可 能 会 受到 数据 库 物 理 设 计 的 影响 ， 包 括 规范 化 、 磁 盘 人 存储、 表 的 数量 、 索 引 设计 、DDL 使 用 及 其 相关 的 参数 。 磁 盘 系 
统 上 数据 库 文件 的 物理 位 置 ， 将 对 应 用 程序 访问 数据 的 性 能 产生 影响 。 由 于 在 同一 磁盘 移动 设备 上 存储 的 数据 增多 ， 性 能 下 降 的 
可 能 性 也 随 之 增 大 。 


磁盘 系统 上 数据 库 文件 的 物理 位 置 ， 将 对 应 用 程序 访问 数据 的 性 能 产生 影响 。 


然而 ,设计 不 是 数据 库 性 能 的 唯一 组 成 部 分 。 数 据 库 的 组 织 会 随时 间 发 生 改 变 。 由 于 数据 的 插入 、 更 新 、 从 数据 库 中 删除 ， 
数据 库 的 效率 也 会 降低 。 此 外 ， 随 着 增加 的 数据 越 来 越 多 ， 承 载 数据 的 文件 可 能 需要 扩大 。 可 以 分 配 其 他 文件 或 文件 区 。 顺 序 杂 
乱 和 文件 增长 都 可 以 降低 性 能 。 


为 了 优化 数据 的 访问 ， 还 需要 对 索引 进行 监测 、 分 析 和 调整 ， 确 保 它 们 对 数据 修改 没有 不 利 的 影响 。 


9.4.3 ”应 用 程序 调 优 


必须 对 应 用 程序 本 身 的 设计 和 效率 进行 监测 。 大 多 数 专 家 认为 ， 高 达 75% 的 性 能 问题 是 由 应 用 程序 不 正确 的 编码 造成 的 。 


SQL 是 罪魁 向 首 ， 编 写 高 效 的 SQL 语句 很 复杂 。 开 发 人 员 需 要 学 习 如 何 正确 地 制定 、 监 测 和 调整 SQL 语句 。 


然而 ， 并 不 是 所 有 的 应 用 程序 问题 都 是 由 SQL 编码 不 正确 造成 的 。SQL 钨 入 的 主机 语言 的 应 用 程序 编码 也 可 能 会 造成 问题 。 
例如 ，Java、COBOL、C++、Ruby 或 Visual Basic 代 码 的 效率 低下 ， 可 能 会 使 数据 库 应 用 程序 的 性 能 受到 影响 。 


并 不 是 所 有 的 应 用 程序 问题 是 由 SQL 编码 不 正确 造成 的 。 


这 三 个 区 域 的 性 能 管理 (系统 、 数 据 库 和 应 用 程序 ) 将 在 第 10、 第 11 和 第 12 章 中 深入 讨论 。 


9.5 ”性 能 调 优 工具 


数据 库 工具 能 够 有 效 地 管理 数据 库 的 性 能 。 有 些 DBMS 供 应 商 提 供 谋 入 式 选 项 和 捆绑 工具 来 解决 数据 库 的 性 能 管理 。 然 而 ， 
这 些 工具 经 常 不 足以 满足 大 规模 或 频繁 使 用 的 数据 库 应 用 程序 。 幸 运 的 是 ,许多 第 三 方 工具 可 以 有 效 地 管理 关键 任务 数据 库 应 用 
程序 的 性 能 。 合 DBA 能够 调整 数据 库 的 工具 分 为 两 大 类 : 性 能 管理 与 性 能 优化 。 


许多 第 三 方 工具 可 以 有 效 地 管理 关键 任务 数据 库 应 用 程序 的 性 能 。 
有 许多 不 同类 型 的 性 能 管理 工具 可 供 选 择 : 


- 性 能 监测 程序 使 DBA 和 性 能 分 析 员 了 解 访问 数据 库 中 应 用 程序 的 性 能 的 三 种 方式 : 实时 、 近 实时 (间隔) 或 基于 历史 趋 
势 。 比 较 先 进 的 性 能 监测 程序 是 基于 代理 的 。 


- 性 能 估算 工具 基于 访问 路 径 、 操 作 环境 和 规则 或 推理 引擎 ， 为 整个 程序 和 SQL 语句 提供 性 能 预测 估计 。 
- 容量 规划 工具 ， 使 DBA 可 以 分 析 当 前 的 环境 和 数据 库 的 设计 并 对 两 者 执行 “whatif”。 


“ SQL 分 析 和 调 优 工具 提供 关系 优化 程序 确定 的 查询 访问 路 径 的 图 形 和 /或 文字 描述 。 这 些 工具 可 以 执行 单个 SQL 语 句 或 整 
个 程序 。 


* 咨询 工具 通过 为 如 何 改写 SQL 获 得 最 佳 性 能 提供 知识 基础 ， 增 强 SQL 分 析 和 调 优 工具 。 先 进 的 工具 可 以 根据 知识 基础 的 纺 
码 技巧 ， 自 动 变更 SQL (收费 ) 。 


“ 系统 的 分 析 和 调 优 工具 ， 使 用 图 形 界 面 〈 例 如 ， 高 速 缓存 和 /或 缓冲 池 调 优 ， 登 录 大 小 ) ， 可 以 使 DBA 查 看 并 变更 数据 库 


和 系统 参数 。 
在 性 能 优化 中 ， 有 几 种 工具 可 以 用 于 调整 数据 库 : 


< 重组 工具 可 以 自动 重建 组 织 最 佳 的 数据 库 。 由 于 数据 库 内 部 的 组 织 〈 例 如 ， 碎 裂 、 行 排序 、 存 储 分 配 ) ， 可 能 会 导致 性 能 


问题 。 


* 缓存 工具 用 于 缓冲 内 存 中 经 常 使 用 的 数据 ， 这 样 访问 的 速度 可 以 比 二 级 磁盘 存储 更 快 。 这 些 工具 可 扩充 DBMS 高 速 缓存 的 
性 能 ， 或 者 更 常见 的 是 ， 集 成 磁盘 存储 子 系统 。 


+ 压缩 工具 ， 使 DBA 将 数据 库 使 用 的 磁盘 存储 量 降 到 最 低 ， 从 而 降低 整个 磁盘 的 利用 率 ， 如 果 可 能 ， 还 可 以 减少 查询 /程序 
的 执行 时 间 ， 因 为 需要 的 l/O 〇 更 少 。 CEB: 由 于 它们 的 压缩 /解压 缩 算 法 的 开销 ， 压 缩 工具 也 可 以 增加 CPU 的 消耗 。) 


* 排序 工具 可 用 于 在 加 载 数据 库 前 对 数据 进行 排序 ， 确 保 行 的 顺序 与 预先 设 定 的 顺序 一 致 。 此 外 ， 排 序 工 具 可 以 用 于 代替 


ORDER BY 或 GROUP BY SQL。 从 关系 数据 库 中 检索 行 ， 有 时 使 用 SQL 和 ORDER BY 的 效率 更 高 。 


DBA 常 常会 将 这 些 工具 结合 使 用 ， 集 成 并 从 中 央 管 理 控制 台 访 问 。 这 使 DBA 可 以 执行 来 自 单个 平台 的 面向 性 能 的 核心 任务 
和 数据 库 管 理 任务 。 


许多 DBMS 供 应 商 提供 了 用 于 管理 数据 库 的 解决 方案 ， 例 如 ，Oracle 提 供 了 Oracle 企 业 管理 器 ，IBM 为 DB2 提 供 了 Data 
Studio，Microsoft 为 此 提供 了 SQL Server Management studio。 第 三 方 供 应 商 提供 了 更 为 强大 的 跨 异 构 环境 的 选项 ， 如 多 个 
不 同 的 数据 库 服务 器 或 操作 系统 。 其 中 一 个 例子 是 Embarcadero Technologies 公 司 的 DBArtisan。 


一 般 情况 下 ， 明 智 的 做 法 是 如 果 你 的 公司 只 有 一 个 DBMS， 可 以 使 用 DBMS 供 应 商 提供 的 解决 方案 作为 唯一 的 管理 工具 。 多 
个 DBMS 引 警 、 跨 多 个 操作 系统 运行 的 企业 应 调查 第 三 方 工具 供应 商 的 异 构 支持 (除了 单方 案 工 具 ) 。 


第 23 章 提供 了 其 他 可 以 简化 数据 库 管 理 和 性 能 管理 任务 的 工具 的 详细 信息 。 


9.6 ”DBMS 的 性 能 基础 


前 面 已 经 定义 了 数据 库 的 性 能 ， 并 从 一 个 较 高 的 水 平 对 其 进行 了 讨论 。 在 继续 深入 讨论 具体 的 系统 、 数 据 库 和 应 用 程序 的 性 
能 之 前 ,介绍 一 些 实现 DBMS 相 关 的 性 能 目标 的 经 验 法 则 : 


. 不 要 调整 过 度 。 大 多 数 DBA 更 倾向 亲自 了 解 DBMS 技 术 的 细节 。 有 时 这 是 必需 的 。 然 而 ， 作 为 一 名 DBA， 你 应 该 始终 牢记 
你 管理 的 数据 库 和 应 用 程序 的 业务 目标 。 明 智 的 做 法 是 根据 业务 用 户 的 期 望 和 预算 管理 性 能 。 尽 管 将 查询 微调 至 最 佳 的 性 能 可 能 
会 很 有 超 也 很 有 挑战 ， 但 这 样 做 可 能 使 你 没有 时 间 执 行 其 他 任务 。 性 能 达到 一 个 预定 义 的 服务 级 别 ， 并 且 业 务 用 户 愿 意 支 付 此 营 
用 ， 这 时 就 不 要 进行 微调 了 。 


* 保持 专注 。 作 为 一 名 DBA， 你 应 该 了 解 每 个 需要 执行 的 任务 ， 并 专注 于 它 。 这 很 重要 ， 因 为 DBMS 很 复杂 ， 当 你 调整 一 个 
地 方 时 ， 你 可 能 会 在 另 一 个 地 方 发 现 问题 。 如 果 是 这 样 ， 最 好 先 记录 你 找到 的 问题 ， 然 后 继续 手头 的 调整 任务 。 一 次 调整 多 个 地 


方 ， 你 会 不 清楚 每 个 任务 对 环境 产生 什么 影响 。 


- 不 要 惊慌 。DBA 和 希望 知道 DBMS 的 一 切 事 情 。 但 是 ， 这 个 期 望 并 不 合理 。 “我 不 知道 ， 但 我 会 找到 ”是 最 重要 的 口头 语 。 
一 名 优秀 的 DBA 应 该 知道 到 哪里 寻找 答案 和 向 谁 寻求 帮助 。 


` 沟通 清楚 。 确 保 调 整 正确 、 高 性 能 的 数据 库 系统 ， 沟 通 是 关键 。DBA 必 须 是 沟通 的 中 心 ， 协 调 业务 用 户 、 程 序 员 、 经 理 
和 SA 之 间 的 讨论 和 工作 量 。 此 外 ， 一 般 情 况 下 ， IT 世界 ， 特 别 是 数据 库 技术 ， 有 时 会 使 用 自己 的 语言 。 许 多 类 似 、 容 易 混 清 的 
术语 四 处 乱 抛 ， 期 待人 们 明白 它们 的 意思 。 一 定 要 明确 定义 即使 最 基本 的 术语 ， 这 样 就 都 讲 同 一 种 语言 了 。 


* 接受 现实 。 很 多 企业 都 在 谈论 积极 主动 ， 但 现实 中 却 很 少 能 在 性 能 问题 出 现 之 前 就 解决 它们 。 是 的 ， 每 一 个 企业 都 是 出 现 
问题 后 才 去 解决 的 。 对 DBA 而 言 ， 这 样 的 环境 令 人 肖 袁 ， 因 为 他 们 宁愿 设计 DBMS 环 境 的 预防 性 维护 。 但 这 需要 预算 、 时 间 和 精 
D (这 些 是 所 有 IT 企业 的 困扰 ) 。 作 为 一 名 DBA， 你 有 时 必须 接受 现实 并 在 问题 发 生 后 处 理 它 们 ， 即 使 你 知道 有 更 好 的 方法 来 
解决 性 能 管理 问题 。 
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只 有 实现 预先 设 定 的 性 能 的 应 用 程序 (访问 关系 数据 库 的 ) 才 是 好 的 应 用 程序 。 聪 明 的 企业 将 实施 全 面 的 性 能 监测 、 


管理 环境 ， 包 括 政策 、 程 序 与 综合 性 能 管理 工具 和 实用 程序 。 


只 有 实现 预先 设 定 的 性 能 的 应 用 程序 【访问 关系 数据 库 的 ) 才 是 好 的 应 用 程序 。 


9.8 回顾 


1. 请 给 出 数据 库 性 能 的 定义 。 

2. 在 应 用 开发 生命 周期 的 哪个 阶段 进行 变更 的 成 本 最 高 ? 

3 .解决 数据 库 应 用 程序 调整 的 三 个 因素 是 什么 ? 

4.80/20 法 则 是 什么 意思 ?如 何 将 其 应 用 到 数据 库 应 用 程序 的 性 能 调整 中 ? 
5. 请 说 出 数据 库 性 能 管理 的 三 个 步骤 ， 并 加 以 描述 。 

6. 讨 论 数据 库 应 用 程序 中 涉及 实施 服务 级 别管 理 的 问题 。 

7. 哪 两 种 数据 库 工 具 可 以 用 来 提供 数据 库 性 能 管理 ? 

8. 多 数 专家 认为 编码 不 正确 的 数据 库 应 用 程序 在 性 能 问题 中 占 多 少 百分比 ? 
9. 工 作 量 的 两 种 或 多 个 组 件 以 争 用 单个 资源 的 条 件 是 什么 ? 


10. 比 较 被 动 和 主动 数据 库 性 能 管理 。 


附加 问题 


为 什么 说 捕获 和 存储 历史 性 能 统计 信息 是 一 种 好 的 做 法 ? 


历史 统计 信息 可 以 帮助 DBA 解 决 哪些 类 型 的 问题 ? 
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第 10 草 ”系统 性 能 


一 个 表现 不 佳 的 系统 会 降低 部 署 在 该 系统 上 的 所 有 数据 库 和 应 用 程序 的 性 能 。 出 现 性 能 问题 的 系统 ， 即 使 再 多 的 数据 库 、 应 
用 程序 或 SQL 调整 都 不 能 提升 它 的 性 能 。 如 图 10-1 所 示 ， 应 用 程序 访问 数据 库 ， 并 且 二 者 均 部 署 在 一 个 整体 的 系统 环境 中 。 
此 ， 系 统 问题 可 能 会 导致 所 有 的 数据 库 和 应 用 程序 都 表现 不 佳 ， 正 如 数据 库 问题 可 能 会 导致 所 有 访问 该 数据 库 的 应 用 程序 表现 不 
佳 一 样 。 


数据 库 


图 10-1 调整 框 
系统 问题 可 能 会 导致 所 有 的 数据 库 和 应 用 程序 都 表现 不 佳 。 


系统 由 硬件 和 软件 组 成 ， 软 件 包 括 DBMS 运 转 所 需 的 软件 以 及 应 用 程序 通过 使 用 DBMS 来 访问 数据 库 的 软件 。DBA 了 解数 据 
库 应 用 程序 将 运行 的 系统 和 操作 环境 至 天 重要 。DBA 要 能 够 促进 系统 任何 组 件 的 变更 ， 以 调整 数据 库 环 境 。 当 然 ，DBA 无 法 掌 
握 系统 的 各 个 方面 ， 因 此 他 需要 和 企业 的 其 他 团队 合作 一 起 发 动 系统 的 变更 。 


以 下 内 容 是 对 系统 相关 的 性 能 和 调整 策略 的 概述 ， 因 为 本 书 的 关注 点 不 在 于 此 ， 所 以 不 对 该 主题 进行 深入 的 讨论 。 但 是 ， 本 
书 将 讨论 系统 配置 问题 、 内 存 的 使 用 、 数 据 库 日 志 配 置 、 系 统 目录 和 锁定 问题 。 


10.1 大 环境 


DBMS 在 一 个 由 其 他 软件 和 硬件 组 件 组 成 的 更 大 的 环境 中 运转 。 每 个 组 件 都 需要 进行 安装 、 配 置 和 有 效 的 管理 ，DBMS 才 能 
正常 运转 。DBA 需 要 理解 DBMS 如 何 与 服务 器 硬件 、 操 作 系 统 以 及 其 他 任何 必需 的 软件 交互 。 适 当 调 整 和 配置 这 些 组 件 以 及 连 
接 ， 可 以 对 系统 性 能 产生 巨大 的 影响 。 


DBMS 在 一 个 更 大 的 环境 中 运转 。 


10.1.1 与 操作 系统 交互 


一 旦 操作 系统 遇 到 性 能 问题 ， 所 有 在 该 操作 系统 上 运行 的 软件 也 都 可 能 遇 到 性 能 问题 。 为 帮助 确保 数据 库 应 用 程序 拥有 最 佳 
的 操作 系统 ，DBA 应 考虑 下 面 的 问题 : 


. 是 否 已 经 为 操作 系统 任务 分 配 了 足够 的 内 存 ? 


. 大 多 数 操作 系统 都 能 够 分 配 特 定数 量 的 磁盘 室 间 作为 交换 区 域 。 一 旦 操作 系统 的 内 存 用 完 ， 就 可 以 使 用 交换 区 域 。 那 么 ， 
是 否 已 经 分 配 了 足够 的 磁盘 空间 用 作 交 换 区 域 呢 ? 


:部署 数据 库 时 ， 数 据 库 文件 是 如 何 分 配 的 ? 与 文件 系统 交互 可 能 会 导致 菜 些 操作 系统 产生 额外 的 开销 。 使 用 原始 磁盘 修改 
数据 库 文 件 可 以 消除 OS 和 文件 系统 的 开销 。 (有 关 原 始 磁 盘 使 用 的 详细 信息 请 参考 第 18 章 。) 


:一些 操作 系统 允许 管理 员 对 运行 在 该 OS 上 的 任务 设置 优先 级 。 那 么 ， 每 一 个 数据 库 相 关 的 任务 是 否 都 已 经 设置 了 优先 级 
呢 ? 某 些 特定 任务 的 优先 级 正确 吗 ? 


- 操作 系统 的 主 版 本 和 次 版 本 是 否 与 DBMS 供 应 商 的 推荐 一 致 ? 是 否 针对 某 适 用 于 特定 品牌 的 数据 库 服务 器 的 ODS 发 布 了 任何 
- 安装 DBMS 时 ， 操 作 系 统 的 配置 参数 是 否 已 经 修改 ? 如果 已 经 修改 ， 那 么 是 否 进行 了 充分 的 测试 以 确保 参数 修改 正确 ， 并 


且 不 会 对 运行 在 该 数据 库 服务 器 上 的 任何 其 他 进程 造成 影响 ? 


10.1.2 ”联合 代理 


正如 前 面 的 章节 所 讨论 的 ，DBMS 必 须 联合 许多 其 他 软件 组 件 一 起 向 终端 用 户 提供 服务 。 联 合 代理 软件 有 : 


事务 处 理 器 ， 如 CICS 和 Tuxedo。 


. 应 用 程序 服务 器 ， 如 WebSphere 或 WebLogic。 

“ 集成 和 ETL 软 件 ， 如 SQL Server Integration Services (SSIS) o 

- 网 络 软 件 ， 如 TCP/IP 和 SNA。 

. 消息 队列 软件 ， 如 MQSeries 和 MSMQ。 

* 网 络 连 接 和 开发 软件 ， 如 ColdFusion 和 Rails。 

- IDE 和 ORM,， 如 Visual Studio、Hibernate、Spring 和 OpenAccess。 
. 编程 语言 ， 如 Java、COBOL 和 C。 


所 有 这 些 联合 代理 都 需要 进行 正确 的 配置 才能 与 DBMS 交 互 ， 了 解 设 置 要 求 也 是 DBA 的 职责 。 在 那些 较 大 的 企业 ，DBA 可 
能 不 会 执行 实际 的 配置 工作 ， 而 是 留 给 那些 专注 于 处 理 和 管理 软件 且 技 术 更 加 娴熟 的 专家 。 而 对 于 较 小 的 企业 ，DBA 可 能 不 得 
不 亲自 去 配置 所 有 的 软件 了 。 


DBMS 必 须 联合 许多 其 他 软件 组 件 一 起 向 终端 用 户 提 供 服 务 。 


10.1.3 ”硬件 配置 


DBMS 在 计算 机 硬件 上 运行 。 硬 件 可 能 是 一 个 大 型 主机 ， 一 个 中 间 UNIX 系 统 ， 或 一 台 搭载 Windows 的 PC。 无 论 规 模 大 
小 ， 硬 件 都 必须 进行 正确 的 安装 和 设置 ，DBMS 才 能 高 效 运作 。 


硬件 必须 进行 正确 的 安装 和 设置 ，DBMS 才 能 高 效 运作 。 

为 了 确保 数据 库 应 用 程序 最 佳 的 硬件 环境 ， 下 面 列 出 了 一 些 DBA 应 考虑 的 问题 : 

- 计算 机 的 硬件 和 容量 适用 于 DBMS 环 境 吗 ? 换 句 话说，DBMS 供 应 商 是 否 推荐 这 种 特殊 的 硬件 实施 ? 
- 计算 机 固件 (如 ROM BIOS) 是 最 新 的 吗 ? 

“ 是 否 有 足够 的 内 存 用 于 安装 所 有 的 系统 软件 (OS、DBMS 和 其 他 联合 代理 ) ? 

" 是 否 分 配 和 配置 了 适当 数量 的 磁盘 存储 空间 供 DBMS 使 用 ? 

- 正在 使 用 什么 类 型 的 磁盘 存储 ? 它 是 否 适 用 于 大 数据 量 和 高 速 数据 库 查询 ? 

- 所 有 的 网 络 电线 是 否 正常 连接 和 运作 ? 

所 有 的 物理 连接 (例如 ， 电 绕 、 插 头 和 电路 板 插座 ) 是 否 都 已 连接 且 全 面 投 入 运作 ? 

+ 硬件 是 否 连 接 不 间断 电源 供应 ? 


+ 硬件 是 否 连接 过 载 保 护 设备 ? 


磁盘 存储 和 I/O 


数据 库 性 能 最 大 的 瓶颈 之 一 是 执行 |/O 操 作 的 物理 成 本 。 数 据 驻 留 在 磁盘 上 ， 磁 盘 是 一 个 机 械 装置 ， 它 需要 移动 机 械 零 件 ， 
才能 从 一 个 旋转 的 盘 片 读 取 编 码 数据 。 这 种 物理 移动 需要 时 间 ， 因 此 任何 能 够 减少 MO 时 间 的 事情 都 可 以 提高 性 能 。 


优化 磁盘 访问 需要 注意 的 是 使 用 固态 设备 (SSD) 。 固 态 设备 实际 上 是 一 种 配置 成 磁盘 驱动 的 计算 机 内 存 。 从 固态 设备 上 读 
取 数 据 时 ， 没 有 物理 组 件 的 MO 操作 (数据 驻 留 在 内 存 中 ， 然 后 从 内 存 转移 到 DBMS， 最 后 到 请 求 者 ) 。 


优化 磁盘 访问 需要 注意 的 是 使 用 固态 设备 。 
可 以 考虑 将 那些 具有 高 性 能 需求 的 数据 库 对 象 放 在 固态 设备 中 ， 而 不 是 放 在 物理 磁盘 驱动 、RAID 设 备 或 存储 区 域 网 路 中 。 


然而 ， 部 署 固态 设备 会 有 一 些 潜在 的 问题 ， 第 一 个 就 是 成 本 。 相 比 传统 的 磁盘 设备 ， 固 态 设 备 的 投入 比 得 到 的 要 多 。 第 二 个 
潜在 的 问题 是 持久 性 。 一 些 固态 设备 需要 持续 的 电力 供应 以 防止 数据 删除 。 在 这 种 情况 下 ， 一 定 要 为 数据 库 对 象 制定 一 套 切实 可 
行 的 备份 和 恢复 计划 。 此 外 ， 基 于 闪存 的 固态 设备 的 寿命 还 没有 达到 | 传统 的 磁盘 设备 的 标准 。 对 于 经 常 需要 修改 的 数据 ， 基 于 闪 
存 的 固态 硬盘 可 以 降低 100 万 到 500 万 次 写 入 。 尽 管 如 此 ， 通 过 使 内 存 的 固态 设备 数 十 年 经 久 不 豪 ， 软 件 控制 器 可 以 缓解 这 个 问 
题 。 需 要 注意 的 是 DRAM 的 固态 硬盘 不 会 有 这 个 问题 。 


有 关 固 态 与 基于 传统 的 磁盘 存储 的 特点 总 结 请 查看 表 10-1。 


表 10-1 态 对 比 传统 磁盘 


性 能 或 实施 注意 事项 固 态 传统 磁盘 


自 旋 时 间 几 秒 钟 

随机 访问 5 ~ 10ms 

读 延 时 高 

REFERE 基于 磁盘 碎片 的 不 同 而 不 同 

碎片 整理 没什么 好 处 ， 因 读 取 速度 极 快 持续 数据 修改 之 后 很 有 必要 

环境 因素 安静 ， 没 有 移动 部 件 ， 易 感性 最 小 亿 械 零件 有 噪音 ， 可 能 会 损坏 

寿命 写 的 次 数 有 限 : 1 ~ 5M( 就 闪存 而 言 ) 机 械 会 有 故障 ， 但 写 / 重 写 没有 限制 
容量 最 大 2TB (一 般 远 低 于 此 值 ) 最 大 3TB (一 般 1 ~ 2TB) 

FEE At 通常 是 硬件 驱动 电量 的 1/3 ~ 1/2 对 于 高 性 能 的 硬件 驱动 ，12 ~ 18 瓦特 
成 本 大 约 2 美元 / 千 兆 字 节 5 ~ 10 美 分 / 千 兆 字 节 


10.1.4 DBMS 组 件 


DBMS 是 一 种 非常 复杂 的 系统 ， 需 要 几 十 万 行 的 计算 机 代码 。 正 因为 如 此 复杂 ， 它 需要 多 个 程序 提供 必要 的 数据 管理 功能 。 
每 一 个 程序 都 与 其 他 程序 进行 互 操作 ， 进 而 形成 数据 库 管理 系统 。 


每 个 DBM S 供 应 商都 将 DBMS 的 功能 分 解 成 不 同 的 组 件 。DBA 需 要 研究 DBMS 的 组 成 ， 进 而 了 解 每 一 个 组 件 以 及 它们 是 如 何 
集成 在 一 起 的 。 有 关 Oracle DBMS 架 构 的 高 级 概述 ， 请 参考 “Oracle 架构 ” 。 
DBA 要 成 为 DBM 内 部 运作 的 专家 ， 以 确保 数据 库 应 用 程序 的 最 佳 环境 。DBMS 任 何 单个 组 件 失败 或 出 现 问题 都 可 能 会 导 至 
每 一 个 访问 数据 库 的 应 用 程序 的 性 能 严重 下 降 。 
Oracle 架 构 
为 了 有 效 地 管理 DOtacle 环 境 ，DBA 必 须 了 解 Otacle 的 基本 “建筑 ”蓝图 。Otacle 由 五 个 基本 组 件 (文件 结构 、 存 储 结构 、 进 


程 、 回 滚 段 和 重 做 上 日志) 构成 ， 它 们 以 集成 的 方式 为 客户 端 任务 提供 支持 。 


Oracle 实 例 是 Oracle 数 据 库 启动 时 分 配 的 所 有 后 台 进 程 和 内 存 结构 的 结合 。Oracle 用 户 经 常 混淆 Oracle 实 例 和 Oracle 数 据 库 。 
Oracle 数 据 库 有 物理 结构 (数据 文件 ) 和 逻辑 结构 (A. KG) 。 物 理 结构 由 这 些 文件 决定 : Oracle 实 例 在 数据 库 创建 期 间 ( 例 
如 ， 控 制 文件 、 日 志文 件 ) 或 DBA 在 正常 操作 期 间 (例如 ，CREATE 表 空间 、CREATE 控 制 文件 ) 在 操作 系统 级 别 上 创建 的 文 
件 。Oracle 数 据 库 包含 三 种 物理 文件 结构 : 


> 控制 文件 : Oracle 数 据 库 所 使 用 的 小 型 管理 文件 。 


“ 重 做 日 志文 件 : 对 数据 所 做 修改 的 记录 。 它 用 于 恢复 的 情况 下 ， 如 果 出 现 故 障 也 不 会 阻止 更 改 的 数据 被 写 入 磁盘 ， 从 而 确 
保 不 会 发 生 数据 丢失 。 


* 数据 库 文件 : 包含 数据 库 信 息 的 文件 ， 其 中 包括 系统 和 应 用 程序 数据 。 


Oracle 参 数 文件 包含 Oracle 实 例 的 所 有 配置 参数 。 这 些 和 参数 可 以 设置 为 不 同 的 值 ， 根 据 系 统 的 运行 配置 以 及 包含 在 Oracle 数 据 
库 中 的 单个 应 用 程序 的 需求 来 定制 Oracle 实 例 。 


Oracle 数 据 库 文 件 包含 与 特殊 数据 库 相 关 的 数据 。 所 有 讨论 的 文件 不 一 定 绝 对 是 常见 的 数据 库 操作 需要 的 ， 但 这 种 配置 会 推 


荐 给 一 种 设计 良好 、 高 效 的 环境 。Otacle 数 据 库 文件 可 以 分 为 以 下 几 类 : 


+ 控制 文件 ， 记 录 Oracle 数 据 库 的 物理 结构 。 控 制 文件 在 每 个 数据 库 启动 期 间 读 取 。 


数据 文件 ， 与 Otacle 表 空间 相关 ， 包 括 系 统 数据 文件 、 应 用 程序 数据 文件 、 默 认 数据 文件 、 临 时 文件 和 回 滚 文件 。 


- 重 做 日 志文 件 〈 数 据 库 的 事务 上 日志) ， 记 录 数 据 的 变更 。 
配置 文件 (Configorg) ， 与 Otacle 客 户 端 相 关 ， 为 Otacle 客 户 端 指定 某 些 默认 值 、 文 件 和 目录 名 称 。 


此 外 ，Oracle 使 用 具体 的 存储 结构 来 执行 DBMS 相 关 的 任务 。 这 些 存储 结构 包含 在 运行 该 Oracle 实 例 的 计算 机 的 主 存 储 器 
(RAM) 中 。Otracle 实 例 的 基本 存储 结构 是 系统 全 局 区 (SGA) 、 程 序 全 局 区 (PGA) 和 排序 


SGA 是 一 组 由 Oracle 实 例 分 配 的 共享 存储 结构 ， 用 于 存放 数据 和 控制 信息 。SGA 包 括 数据 高 速 缓存 、 重 做 日 志 缓冲 区 以 及 供 
SQL 语句 解析 和 处 理 的 共享 池 。 


PGA 是 用 户 和 后 台 进 程 的 工作 区 。 每 个 进程 都 有 自己 的 PGA。PGA 的 内 容 将 根据 进程 的 类 型 和 Otacle 的 配置 而 有 所 不 同 。 
Ortacle 排 序 区 是 用 来 对 数据 进行 排序 、 整 理 和 分 组 的 存储 结构 ， 当 有 用 户 进程 请 求 排序 时 。 


最 后 是 Oracle 进 程 ， 即 大 多 数 数据 管理 工作 完成 的 地 方 。 每 个 进程 都 由 一 系列 的 任务 组 成 。Oracle 有 两 种 类 型 的 进程 : AP 
进程 和 Oracle 进 程 。 创 建 用 户 进 程 是 为 了 执行 应 用 程序 的 代码 。Oracle 进 程 被 其 他 进程 调用 从 而 代表 调用 进程 执行 具体 的 功能 
Oracle 进 程 可 以 进一步 分 解 成 服务 器 进程 和 后 台 进 程 。 服 务 器 进程 与 用 户 进 程 进 行 通信 ， 充 当 用 户 进 程 和 SGA 信 息 之 间 的 “ 继 
点 ”。 后 台 进 程 为 Oracle 实 例 执 行 指定 的 数据 管理 和 处 理 功 能 。 


下 面 逐 一 介绍 Oracle 后 人 台 进 程 的 功能 。 


当 用 户 进程 失败 并 报错 时 ， 进 程 监视 器 (PMON) 后 台 进 程 负责 执行 “清理 任务 ”。PMON 清 理 缓存 、 释 放 锁 以 及 执行 其 他 


杂项 任务 。 


系统 监视 器 (SMON) 后 台 进 程 负责 在 启动 期 间 提供 实例 恢复 。SMON 还 清理 不 再 使 用 的 临时 段 ， 将 自由 空间 压缩 成 连续 的 
区 段 ， 在 并 行 服务 器 环境 中 还 为 失败 的 CPU 提 供 实 例 恢复 。 


数据 库 写 入 器 (DBWR) 进程 负责 将 内 存 数据 高 速 缓存 的 数据 写 入 物理 磁盘 文件 中 。 


日 志 写 入 器 (LGWR) 负责 管理 重 做 日 志 缓 冲 区 。 如 果 Oracle 实 例 具 有 的 检查 点 超出 了 LGWR 进 程 的 处 理 范围 ， 检 查 点 任务 
可 能 会 转交 给 检查 点 (CKPT) 后 台 进 程 。 当 联机 的 重 做 日 志 写 满 时 ， 归 档 器 (ARCH) 进程 通过 将 这 些 日 志文 件 复 制 到 辅助 存 
储 器 设备 来 执行 日 志 归 档 。 


恢复 (RECO) 后 台 进 程 自动 解决 故障 ， 包 括 分 布 式 事务 。 


最 后 ，Otacle 部 署 了 用 户 和 服务 器 进程 。 用 户 进程 连接 着 客户 端 应 用 程序 和 Otacle 实 例 。 服 务 器 进程 则 解析 并 执行 SQL 语 
多 ， 以 及 执行 所 有 需要 将 结果 发 送 回 请 求 应 用 程序 的 任务 。 


这 篇 关于 Otacle 结 构 的 概述 必定 很 简短 。 因 为 它 的 目的 是 说 明 DBMS 组 件 必 须 专业 化 。Ortracle DBA 需 要 了 解 所 有 这 些 组 件 ， 
它们 是 如 何 相 互 作用 的 ， 以 及 如 何 对 它们 进行 调整 才能 优化 Oracle 系 统 和 应 用 程序 的 性 能 。 


10.2 ”DBMS 安 六 和 配置 问题 


每 个 数据 库 管理 系统 都 提供 允许 DBA 对 数据 库 环 境 各 方面 进行 配置 的 参数 。 有 多 种 方式 可 以 完成 配置 ， 这 取决 于 DBMS。 一 
些 流行 的 配置 方法 有 : 运行 系统 程序 来 设置 / 重 置 值 ; 编辑 有 参数 设置 的 文件 ; 在 DBMS 提 示 符 处 发 出 命令 ;使 用 DBMS 的 选项 
组 装 参数 规范 。 无 论 使 用 哪 种 方法 配置 DBMS，DBA 都 需要 为 DBMS 指 定 各 种 参数 来 影响 DBMS 的 操作 方式 。 


大 多 数 DBMS 软 件 都 附带 供应 商 提供 的 默认 值 。 但 是 默认 值 通常 不 足以 支持 开发 强大 的 生产 应 用 程序 。 本 节 将 讨论 一 些 常见 
的 配置 参数 ， 以 及 如 何 调整 它们 。 


默认 值 通常 不 足以 支持 开发 强大 的 生产 应 用 程序 。 


10.2.1 配置 类 型 
安装 DBMS 时 或 之 后 都 可 以 对 DBMS 进 行 配置 。 在 安装 过 程 中 ，DBA 或 SA 可 以 选择 改变 配置 参数 ， 也 可 以 保留 参数 的 默认 
值 。 但 上 默认 值 几乎 总 是 错误 的 。 根 据 使 用 该 DBMS 的 数据 和 应 用 程序 的 常识 来 设置 参数 通常 会 比较 好 。 


DBMS 一 旦 安装 完成 并 且 可 以 使 用 ， 都 会 提供 一 种 改变 配置 参数 的 方法 。 根 据 DBMS 的 不 同 ， 参 数 可 能 变 成 动态 的 、 非 动态 
AY, 或 两 者 兼 有 。 


根据 DBMS 的 不 同 ， 参 数 可 能 变 成 动态 的 、 非 动态 的 ， 或 两 者 兼 有 。 


动态 参数 不 需要 重启 数据 库 服务 器 就 可 以 生效 。 例 如 ， 在 Microsoft SQL Server 中 执行 RECONFIGURE 命 令 会 导致 动态 参 
数 立 即 生效 。 适 当 的 命令 发 出 后 ， 参 数 的 值 就 会 改变 并 且 DBMS 也 因此 可 以 运转 了 。 


为 了 让 非 动态 参数 生效 ，DBMS 必 须 重启 。 当 然 ， 参 数 的 值 必须 改变 (通常 与 动态 参数 的 方法 相同 或 类 似 ) ， 且 只 有 在 
DBMS 重 启 之 后 ， 非 动态 参数 才 会 生效 。 


10.2.2 ”内 存 使 用 


关系 数据 库 喜 欢 内 存 。 配 置 RDBMS 的 内 存 使 用 将 是 DBA 面 临 的 单个 最 重要 的 系统 性 能 调整 任务 。DBMS 使 用 随机 存 取 内 存 
来 缓存 DBMS 所 需 的 数据 和 其 他 资源 。 这 么 做 是 因为 从 内 存 读 取 数 据 的 成 本 远 低 于 从 磁盘 读 取 数 据 。 因 此 ， 作 为 一 种 经 验 法 则 ， 
为 DBMS 提 供 的 内 存 越 大 ， 性 能 就 越 好 。 当 然 ，DBMS 必 须 配置 正确 才能 有 效 地 使 用 内 存 。 


DBMS 中 的 “地 方 ” 就 是 内 存 (相对 于 磁盘 ) 。 “贵重 物品 ”就 是 数据 页 、 查 询 计划 和 其 他 数据 库 资 源 。 典 型 的 DBMS 使 用 
缓存 来 让 资源 在 内 存 中 保留 的 时 间 更 长 。 资 源 在 内 存 绥 存 的 时 间 越 长 ， 后 续 请 求 该 资源 避免 产生 昂贵 |/O 操 作 的 机 会 就 越 好 ， 如 
图 10-2 所 示 。 
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图 10-2 ”内 存 缓存 资源 的 值 
DBMSs 产 品 使 用 多 个 高 速 缓存 或 缓冲 区 来 降低 MO 的 成 本 ， 每 个 DBMS 使 用 的 术语 不 同 ， 但 一 般 缓 存 的 资源 相同 。 


从 数据 库 读 取 真 实数 据 时 使 用 数据 缓 看 来 避免 /O 操 作 。 访 问 内 存 数 据 的 速度 远 远大 于 访问 磁盘 数据 。 因 此 ， 关 系数 据 库 中 
所 有 的 数据 访问 都 通过 一 个 缓存 区 ( 见 图 10-3) 。 内 存 访问 通常 以 微 秒 计 ， 而 磁盘 |/O 访 问 则 以 毫秒 计 。 当 程序 需要 某 张 表 的 一 
行 数据 时 ，DBMS 将 从 磁盘 检索 该 表 所 在 的 页 面 ， 并 将 检索 到 的 页 面 存储 在 数据 高 速 缓存。 基本 上 ，DBMS 将 缓存 视 为 一 个 暂 存 
区 。 如 果 行 有 变更 ， 该 变更 会 写 入 数据 高 速 缓存 中 的 页 面 。 最 终 ，DBMS 会 将 数据 高 速 缓存 中 的 页 面 写 回 到 磁盘 。 当 某 个 应 用 程 
序 需 要 的 数据 所 在 的 页 面 已 经 在 数据 高 速 缓存 中 时 ， 该 应 用 程序 就 不 用 等 待 从 磁盘 检索 页 面 了 。 依 据 DBMS， 该 存储 结构 也 可 以 
称 为 缓冲 池 。 


从 数据 库 读 取 真实 数据 时 使 用 数据 缓存 来 各 免 /O 操 作 。 
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图 10-3 ”数据 高 速 缓存 (或 缓冲 池 ) 


程序 缓存 用 来 存储 SQL 以 及 程序 相关 的 结构 。 在 发 出 SQL 语 句 检索 或 修改 数据 之 前 ， 该 语句 首先 要 由 DBMS 进 行 优化 。 优 化 
过 程 会 创建 一 个 内 部 结构 ， 表 示 DBMS 用 于 读 取 数据 的 访问 路 径 。DBMS 可 以 在 程序 缓存 中 存储 这 些 访 问 路 径 ， 并 且 每 次 运行 程 
序 或 SQL 语句 时 重用 它们 。 这 可 以 优化 应 用 程序 的 性 能 ， 因 为 优化 程序 不 必 每 次 运行 SQL 时 都 执行 。 相 反 ， 在 SQL 首次 发 出 时 执 
行 优 化 ， 后 续 执 行 只 需要 从 程序 缓存 中 检索 访问 路 径 。 每 个 DBM S 都 提供 了 类 似 的 功能 ， 只 是 名 称 和 功能 有 所 不 同 。 


DBMS 中 另 一 种 常见 的 存储 结构 是 排序 组 在。 排序 缓存 用 来 代替 临时 磁盘 存储 在 内 存 存 储 中 间 排 序 的 结果 。 可 以 在 内 存 中 执 
行 的 排序 功能 越 多 ， 排 序 就 越 好 。 许 多 关系 数据 库 的 操作 都 用 到 了 排序 例如， 分组、 排序 、 合 并 操作 和 某 些 类 型 的 连接 。 


排序 缓存 用 来 代替 临时 磁盘 存储 在 内 存 存储 中 间 排 序 结果 。 


DBMS 也 可 以 使 用 其 他 内 部 结构 的 绥 在 。 每 个 DBMS 的 部 署 都 是 独特 的 。 为 了 完成 关系 操作 ，DBMS 可 能 需要 创建 对 终端 用 
户 不 可 见 的 内 部 结构 。 然 而 ，DBA (有 时 程序 员 ) 需要 了 解 该 内 部 结构 。DB2 管 理 数据 库 时 使 用 的 内 部 DBD (数据 库 描述 符 ) 
结构 就 是 其 中 一 个 例子 ，DBD 从 来 没有 外 部 用 户 ， 但 每 次 应 用 程序 访问 数据 库 的 任何 对 象 ，DB2 都 必须 将 DBD 加 载 到 一 个 称 为 
EDM 池 的 内 存 区 域 。DB2 还 使 用 EDM 池 来 缓存 动态 SQL 的 访问 路 径 和 其 他 内 部 结构 。 当 程序 需求 和 使 用 模式 发 生变 化 时 ，DB2 
DBA 需 要 为 EDM 池 分 配 足够 的 内 存 并 对 EDM 池 的 效率 进行 监控 。 


DBMSs 也 可 以 将 日 志 记 录 缓 冲 到 一 个 独立 的 数据 库 日 志 缓 在 中 。 此 外 ，DBMS 可 以 部 署 两 个 日 志 缓 存 ， 一 个 用 于 日 志 写 入 ， 
一 个 用 于 日 志 读 取 。 数 据 库 日 志保 留 了 数据 库 所 有 变更 的 记录 。 日 志 写 入 缓存 用 来 加 速 数据 库 的 修改 。 变 更 后 的 数据 写 入 日 志 缓 
存 并 在 一 段 时 间 内 异步 写 入 磁盘 。 当 日 志 写 入 以 这 种 方式 缓冲 时 ， 数 据 库 日 志 便 不 再 是 系统 和 应 用 性 能 的 瓶颈 了 。 日 志 读 取 缓 存 
用 于 ROLLBACK 和 RECOVER 操 作 ， 两 者 均 需 访问 日 志 以 撤销 或 重新 应 用 数据 库 的 变更 。 当 请 求 日 志 记 录 时 ， 它 们 将 在 日 志 读 取 
缓存 的 内 存 中 进行 缓冲 。 


DBMS 也 可 以 将 日 志 记 录 缓 冲 到 一 个 独立 的 数据 库 日 志 缓 存 中 。 


内 存 消耗 的 额外 区 域 


关系 数据 库 系 统 除了 使 用 各 种 缓存 和 绥 冲 池 ， 还 需要 内 存 。 一 般 来 说 ，DBMS 的 安装 和 配置 程序 允许 DBA 对 DBMS 的 内 存 消 


耗 进行 分 配 和 调整 。 其 中 一 些 常 见 的 DBMS 内 存 消耗 区 域 有 : 
* 用 户 和 连接， 每 个 到 DBMS 的 并 发 用 户 连 接 (忽略 客户 端 连 接 的 类 型 ) ， 都 需要 内 存 来 维护 和 管理 。 
* 设备， 数据 库 所 使 用 的 设备 可 能 需要 系统 内 存 来 维护 和 使 用 。 


开放 数据 库 ， 大 多 数 的 DBMS 都 提供 一 个 参数 ， 用 于 指定 在 任何 时 间 可 以 同时 开放 的 数据 库 的 最 大 数目 。 每 个 开放 的 数据 
库 都 需要 DBMS 内 存 。 


. 开放 对 象 ， 可 能 还 存在 另 一 个 参数 ， 用 于 识别 在 任何 时 间 可 以 同时 开放 的 数据 库 对 象 的 最 大 数目 ， 这 些 数据 对 象 包 括 表 、 
索引 以 及 任何 其 他 在 用 的 数据 库 对 象 。 每 个 开放 数据 库 对 象 都 需要 内 存 。 


* 锁 ， 每 个 并 发 桂 有 的 锁 都 需要 内 存 。DBMS 应 为 那些 可 以 同时 持 有 的 并 发 锁 的 数量 提供 一 个 配置 参数 。 


. 缓存 ， 前 面 章节 讨论 的 各 种 缓存 。 
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如 果 天 系数 据 库 喜 欢 内 存 ， 那 么 ， 应 该 分 配 多 少 内 人 存 呢 ”这 不 是 几 句 话 就 能 回答 的 问题 。 有 种 诱 人 的 回答 是 “多 到 足以 完成 
工作 ”， 但 这 并 不 能 帮助 DBA 在 正确 的 地 方 分 配 适 当 的 内 存 。 


每 个 DBMS 都 使 用 内 存 ， 但 数量 不 同 所 做 的 事情 也 不 同 。 最 好 的 方法 便 是 查看 DBMS 供 应 高 的 使 用 手册 来 确定 每 种 资源 需要 
多 大 的 内 存 。 然 后 ， 可 以 估计 每 种 资源 的 使 用 需求 并 大 概 计 算出 DBMS 所 需 的 内 存量 。 


每 个 DBMS 都 使 用 内 存 ， 但 数量 不 同 所 做 的 事情 也 不 同 。 


例如 ，SQL Server 的 每 个 锁 需 要 约 75 字 节 。 为 了 配置 锁 需 要 的 内 存量 ，DBA 需 要 估计 并 发 事务 的 总 数 以 及 每 个 事务 的 锁 的 
平均 数 。 这 些 都 完成 后 ， 计 算 DBMS 锁 需要 的 内 存 就 很 简单 了 : 


并 发 锁 = 并 发 事务 的 数量 X 每 个 事务 的 锁 的 数量 X75 


以 上 计算 公式 的 结果 给 出 了 SQL Server 系 统 中 锁 使 用 的 大 概 内 存量 (以 字 节 计 ) 。 当 然 ， 你 的 环境 中 并 发 事务 的 数量 和 每 
个 事务 的 锁 的 数量 可 能 难以 确定 。 你 可 以 使 用 用 于 用 户 连 接 总 数 的 DBMSs 的 配置 值 蔡 代 并 发 事务 的 数量 。 如 果 每 个 事务 的 锁 的 数 
量 不 可 用 ， 那 么 可 以 借助 一 些 典型 的 程序 来 得 出 一 个 大 概 值 。 然 后 ， 针 对 每 种 消耗 内 存 的 数据 库 资源 都 可 以 重复 这 个 过 程 。 当 
然 ， 数 据 缓存 应 分 别 对 待 ， 这 在 10.2.3 节 中 讨论 。 


每 种 资源 都 重复 这 个 过 程 以 后 ， 你 将 得 出 安装 数据 库 服 务 器 的 内 存量 。 预 留 一 些 喘息 空间 或 许 是 个 不 错 的 做 法 ， 用 于 支持 意 
料 之 外 的 应 用 程序 、DBMS 和 操作 系统 升级 所 需 的 额外 内 存 ， 以 及 其 他 未 能 预见 的 事情 。 这 意味 着 安装 的 内 存 要 比 计算 的 稍微 大 
一 些 。 但 不 要 预 留 太 多 的 喘息 空间 。 安 装 内 人 存 是 要 使 用 的 ， 而 不 是 要 保存 的 。 


预 留 一 些 喘息 空间 是 个 不 错 的 做 法 。 


10.2.3 ”数据 高 速 缓 仓 


DBA 了 解数 据 高 速 缓存 的 基本 操作 很 重要 。 在 任何 特定 的 时 间 点 ， 数 据 高 速 缓存 都 由 以 下 三 种 不 同类 型 的 页 面 组 成 : 


* 在 使 用 的 页 面 ，DBMS 当前 正在 读 取 和 更 新 的 页 面 。 这 些 页 面 对 于 其 他 数据 库 处 理 是 不 可 用 的 。 


“ 更 新 的 页 面 ， 页 面 数 据 已 经 修改 但 尚未 写 入 磁盘 。 这 些 页 面 对 于 其 他 数据 库 处 理 也 不 可 用 。 
可 用 页 面 ， 即 未 使 用 的 页 面 。 这 些 页 面 对 于 其 他 数据 库 处 理 是 可 用 的 。 可 以 将 新 数据 写 入 数据 高 速 缓存 的 可 用 页 面 。 


数据 高 速 缓存 的 性 能 取决 于 分 配 的 内 存 的 效率 。 例 如 ， 如 果 数 据 高 速 缓存 充斥 着 不 可 用 的 页 面 ，DBMS 会 触发 同步 写 入 以 增 
加 数据 高 速 缓存 的 空间 。 同 步 写 入 可 以 减缓 数据 库 处理 ， 因 为 每 个 写 入 请 求 都 必须 等 待 数据 真正 地 物理 写 入 磁盘 。 根 据 数据 库 应 
用 程序 使 用 的 处 理 类 型 ，DBA 要 能 够 调整 数据 缓存 的 参数 和 大 小 ， 使 数据 缓冲 变 得 更 高 效 。 


监测 和 调整 数据 高 速 缓存 


确保 缓存 的 大 小 适中 是 拥有 高 效 的 数据 缓存 最 关键 的 方面 。 数 据 高 速 缓存 太 大 既 浪费 内 存 ， 又 可 能 会 导致 缓存 中 的 页 面 移出 
到 辅助 存储 器 ; 太 小 则 会 导致 磁盘 的 频繁 写 入 ， 甚 至 会 导致 反复 从 磁盘 交换 数据 高 速 缓存 的 页 面 。 


确保 高 速 缓存 大 小 适中 很 重要 。 


调整 数据 高 速 缓存 的 复杂 性 因 DBMS 而 有 所 不 同 ， 也 取决 于 可 用 于 数据 高 速 缓存 的 配置 和 调整 参数 。 一 些 DBMS (如 DB2) 
提供 了 多 个 缓冲 池 ， 可 以 独立 配置 和 调整 多 个 参数 。 还 有 一 些 DBMS (如 SQL Server) 则 更 基本 ， 每 个 数据 库 有 一 个 数据 高 速 
缓存 。 但 无 论 哪 种 DBMS，DBA 都 应 该 监测 每 个 数据 高 速 缓存 或 缓冲 池 的 读 取 效 率 。 


数据 高 速 缓存 的 读 取 效率 是 一 个 百分比 ， 用 于 跟踪 绥 存 如 何 履行 其 主要 职责 (避免 物理 磁盘 |/O 操 作 ) 。 每 个 数据 高 速 缓存 
的 读 取 效 率 的 计算 方法 为 : 数据 请 求 的 总 数 减 去 实际 执行 的 /O 的 次 数 ， 然 后 除 以 数据 请 求 的 总 数 ， 即 


读 取 效 率 = 〈 数 据 库 I/O 请 求 的 次 数 - 物理 I/O 的 次 数 ) /数据 库 I/O 请 求 的 次 数 


换 句 话说 ， 读 取 效 率 显 示 了 在 数据 高 速 缓存 (或 缓冲 池 ) 中 发 现 数据 页 面 的 时 间 的 百分比 。 百 分 比 越 高 ， 就 说 明 缓冲 池 的 效 
率 就 越 高 。 当 数据 页 面 可 以 在 内 人 存 的 缓冲 区 发 现 而 无 需 物理 /OO 时， 性 能 就 提高 了 。 


I/O 请 求 和 实际 物理 Il/O 操 作 的 次 数 可 以 通过 DBMS 的 跟踪 记录 或 数据 库 性 能 监控 器 得 到 。 一 定 要 检查 所 有 的 I/O 请 求 ， 包 括 
同步 和 异步 提出 的 。 许 多 DBMS 可 以 预测 I/O 的 需求 并 事先 调度 多 个 块 的 读 取 。 例 如 ，DB2 部 署 了 顺序 预 取 以 读 取 多 个 页 面 到 绥 
冲 池 ， 为 那些 访问 大 量 数据 的 顺序 读 取 做 准备 。 


根据 DBMS 的 不 同 ，DBA 可 能 需要 启动 DBMS 的 外 部 仪表 跟踪 。 每 个 DBM S 都 有 一 套 自己 的 可 供 检查 的 仪表 信息 。 并 且 ( 根 
据 性 能 监控 器 的 类 型 ) 可 能 不 需要 DBA 启 动 跟踪 ， 因 为 监控 器 可 以 根据 需要 启动 和 停止 跟踪 。 监 控 器 还 可 能 使 用 其 他 方法 来 从 
DBMS 获 取 性 能 信息 。 


作为 一 个 经 验 法 则 ， 读 取 效 率 等 于 或 高 于 80% 对 数据 高 速 缓存 更 适合 。 当 然 ， 读 取 效 率 的 值 会 因 处 理 类 型 的 不 同 而 有 所 不 
同 。 许 多 连续 的 进程 可 能 会 导致 数据 缓存 溢出 和 效率 下 降 。 此 外 ， 那 些 拥 有 多 个 进程 却 每 周 或 每 月 只 访问 一 次 数据 的 系统 ， 由 于 
很 少 重用 数据 读 取 效 率 可 能 会 更 低 。DBA 应 该 了 解 发 生 在 每 个 数据 高 速 缓存 的 数据 库 处 理 的 类 型 ， 并 根据 发 生 的 处 理 来 衡量 该 
数据 缓存 的 读 取 效率 。 


读 取 效 率 等 于 或 高 于 80% 对 数据 高 速 缓存 更 适合 。 


当 读 取 效率 始终 低 于 80% 时 ， 考 虑 通过 以 下 几 种 方式 来 进行 调整 : 增加 数据 高 速 缓存 的 大 小 ， 修 改 使 用 数据 高 速 缓存 的 并 发 
进程 的 数目 或 类 型 ， 减 少 分 配给 该 数据 缓存 的 表 和 索引 的 数目 。 这 些 变更 可 能 会 对 可 用 性 产生 影响 ， 因 为 DBM 必须 停止 并 重新 
启动 来 应 用 这 些 变更 。 每 个 DBMS 对 于 实施 数据 高 速 缓存 的 变更 有 不 同 的 需求 。 


根据 DBMS 的 不 同 ，DBA 或 许可 以 通过 改变 顺序 和 并 行 操作 保留 的 绥 存 量 来 更 好 地 配置 数据 缓存 。 大 表 的 扫描 可 以 快速 占有 
数据 高 速 缓 企 。 因 此 ， 为 顺序 扫描 预 留 整个 缓存 的 一 个 子 集 可 能 会 提升 数据 高 速 缓存 的 整体 性 能 。 当 然 ， 如 果 使 用 数据 高 速 缓存 


的 大 部 分 操作 本 质 上 是 连续 的 ， 反 过 来 也 可 能 行 得 通 。 

大 表 的 扫描 可 以 快速 占有 数据 高 速 缓存 。 

调整 数据 高 速 缓存 的 其 他 可 能 性 (DBMS 供 应 商 提供 或 作为 附加 产品 ) 包括 : 创建 额外 的 缓存 备份 数据 高 速 组 存 ， 限 定 内 存 
中 的 特定 页 面 ， 以 及 随 着 吞吐 量 的 增加 自动 增加 数据 高 速 缓存 的 大 小 。 
监测 并 调整 程序 缓存 

DBA 必 须 对 程序 缓存 的 有 效 性 进行 监测 ， 帮 助 提升 数据 库 应 用 程序 和 查询 的 效率 。 尽 管 程序 缓存 因 DBMS 的 不 同 而 有 显著 不 
同 ， 但 总 体 思路 是 相同 的 ， 即 将 优化 的 SQL 结构 保留 在 内 存 中 ， 以 便 它 们 可 以 由 后 续 任务 重用 而 无 需 改写 或 从 磁盘 重新 读 取 。 


为 了 确保 最 佳 性 能 ， 程 序 缓存 的 大 小 必须 正确 ， 以 容纳 所 有 可 能 同时 运行 的 SQL。DBA 需 要 了 解 将 要 在 缓存 运行 的 应 用 程序 
的 信息 ， 以 便 有 效 地 分 配 程序 缓存 的 大 小 。 用 于 衡量 数据 高 速 缓存 有 效 性 的 读 取 效 率 的 计算 公式 ， 也 可 用 于 程序 缓 仔 。 对 于 程序 
缓存 ， 读 取 效 率 计 算 的 是 DBM 需要 对 SQL 进行 重新 优化 的 时 间 。 其 值 通 常 在 60%~ 80%。 当 然 ， 这 个 百分比 与 DBMS 和 执行 的 
缓存 的 类 型 有 关 ， 也 与 应 用 程序 的 类 型 以 及 相同 的 SQL 和 程序 运行 的 次 数 有 天。 “DB2 的 EDM 工 具 ” 就 是 一 个 有 关 程 序 缓存 的 
例子 。 


程序 缓存 的 大 小 必须 正确 ， 以 容纳 所 有 可 能 同时 运行 的 SQL。 
DB2 的 EDM 工 具 


IBM 用 于 z/OS 在 内 存 区 域 缓存 SQL 的 DB2， 称 为 环境 描述 符 管理 池 ， 或 简称 EDM 池 。EDM 池 包括 应 用 程序 计划 和 程序 包 的 
有 效 的 框架 结构 ， 优 化 的 动态 SQL 计划 ， 数 据 库 描述 符 和 程序 授权 列表 。EDM 池 作为 一 种 包罗 万 象 的 内 存 区 域 ， 可 供应 用 程序 
和 SQL 语句 运行 时 使 用 。 


如 果 EDM 池 太 小 ，DB2 会 在 目录 中 (用 于 内 部 DB2 结 构 的 专门 的 系统 目录 ) 增加 LI/O 活 动 。 另 外 一 种 症状 可 能 是 会 导致 响应 
时 间 的 增加 ， 因 为 请 求 的 结构 先 从 磁盘 读 取 然 后 加 载 到 EDM 池 的 内 存 中 。 


10.2.4 “开放 的 ”数据 对 象 
作为 数据 库 应 用 程序 进程 ，DBMS 可 能 需要 开放 某 些 数据 库 对 象 的 访问 并 对 它们 进行 维护 。DBM 可 能 有 一 个 配置 选项 来 设 
置 这 个 数字 ， 但 这 些 数字 起 初 很 难 选 定 。 随 着 时 间 的 推移 ， 通 过 对 数据 库 系统 进 行 监控 ， 就 可 以 提供 合适 的 值 了 。 


首先 ， 通 常 只 需 指定 一 个 值 ， 开 放 所 有 的 生产 数据 库 和 对 象 。 但 每 个 开放 的 数据 库 对 象 都 消耗 内 存 。 因 此 ， 一 种 好 的 方法 是 
通过 考虑 以 下 几 个 方面 来 控制 这 个 值 : 数据 库 部 署 的 规模 、 应 用 程序 处 理 的 类 型 和 可 用 的 内 存量 。 


每 个 开放 的 数据 库 对 象 都 消耗 内 存 。 


10.2.5 ”数据 库 日 志 


数据 库 日 志 是 另外 一 种 会 对 性 能 产生 影响 的 数据 库 系统 配置 选项 。 数 据 库 日 志 ， 有 时 也 叫做 事务 日 志 ， 是 数据 库 管 理 系统 的 
基本 组 成 部 分 。 数 据 库 中 所 有 应 用 程序 的 变更 都 连续 记录 在 数据 库 日 志 中 ( 见 图 10-4) 。 通 过 这 些 信息 ，DBMS 可 以 跟踪 哪个 


数据 库 中 所 有 应 用 程序 的 变更 都 连续 记录 在 数据 库 日 志 中 


a CACHED oo a Ss) 
___ CACHED -一 一 、， 
UPDATE INSERT DELETE ee | 
1 ~ LOG | 
B a 


UPDATE INSERT 


od CACHED ~ DELETE 
2) 


图 10-4 ”数据 库 事务 的 日 志 


数据 库 日 志 创 建 的 方式 取决 于 DBMS。 一 些 DBMS 会 指定 数据 库 系 统 级 的 日 志 ， 一 些 DBMS 则 为 数据 库 系 统 内 创建 的 每 个 数 
据 库 都 定义 一 个 数据 库 日 志 ， 另 一 些 DBMS 还 提供 启动 和 禁用 日 志 的 参数 。 一 般 情况 下 ， 应 避免 禁用 那些 数据 有 价值 的 数据 库 或 
数据 库 系统 的 日 志 。 换 句 话说 ， 应 考虑 关闭 那些 仅 用 于 测试 数据 库 的 日 志 。 


根据 DBM 的 不 同 ， 数 据 库 日 志 可 能 包含 几 个 文件 。 例 如 ，Oracle 使 用 事务 日 志和 回 滚 段 来 实现 本 节 描 述 的 所 有 功能 。 


在 正常 的 数据 库 应 用 进程 中 ， 会 发 出 SQL INSERT、UPDATE 和 DELETE 来 修改 数据 库 中 的 数据 。 随 着 这 些 数 据 库 修 改 的 进 
行 ， 数 据 库 的 事务 日 志 也 将 增长 。 由 于 每 个 数据 库 变更 都 会 记录 ，DBA 需 要 积极 监控 事务 日 志文 件 的 大 小 。 因 为 数据 是 不 断 变 
更 的 ， 所 以 日 志 也 将 不 断 增长 。 


数据 库 事务 日 志 是 一 种 预 写 日 志 。 这 意味 着 对 数据 库 表 进 行 的 变更 首先 要 在 事物 日 志 中 记录 。 当 数据 库 的 修改 完全 记录 在 日 
志 中 时 ， 事 务 的 恢复 才 有 保障 。 


数据 库 事务 日 志 是 一 种 预 写 日 志 。 


通常 情况 下 ，DBMS 使 用 一 个 系统 检查 点 来 保证 所 有 的 日 志 记 录 和 所 有 修改 了 的 数据 库 页 面 都 安全 地 写 入 磁盘 。 数 据 库 系 统 
检查 点 的 频率 可 以 由 DBA 通 过 数据 库 配 置 参 数 进行 设置 。 检 查 点 的 频率 通常 会 设置 为 一 个 预定 的 时 间 间 隔 或 写 入 的 日 志 记 录 的 


一 个 预 设 码 。 


通常 ， 数 据 库 日 志 会 记录 以 下 类 型 的 信息 : 


个 事务 的 起 止 时 间 。 


$ 


- 每 个 事务 期 间 实 际 的 数据 变更 以 及 撤销 所 做 修改 的 足够 多 的 信息 (使 用 数据 前 后 的 图 像 ) 。 


“ 数据 库 页 面 的 分 配 和 释放 。 


- 每 个 事务 的 实际 COMMIT 或 ROLLBACK。 


DBMS 可 以 利用 这 些 信息 来 实现 数据 的 完整 性 操作 ， 从 而 确保 数据 的 一 致 性 。 当 DBMS 重 启 、 事 务 回 滚 以 及 将 数据 库 还 原 到 
以 前 的 状态 时 ， 都 会 用 到 事务 日 志 。 接 下 来 逐一 介绍 这 些 情况 。 


当 DBMS 重 启 时 ， 每 个 数据 库 都 经 历 了 一 次 恢复 的 过 程 。 在 重启 过 程 中 ，DBMS 将 通过 检查 来 确定 哪些 事务 必须 向 前 滚动 。 
如 果 所 有 修改 实际 上 都 从 缓存 写 入 磁盘 ， 事 务 何 时 发 生 这 种 情况 是 未 知 的 。 检 查 点 强制 将 所 有 已 修改 的 页 面 趣 入 磁盘 。 因 此 ,， 它 
代表 了 启动 恢复 必须 向 前 滚动 事务 的 时 间 点 。 因 为 所 有 在 检查 点 前 面 修改 了 的 页 面 保证 都 准确 地 写 入 了 磁盘 ， 检 查 点 前 做 出 的 任 
何 操作 都 没有 必要 向 前 滚动 。 


当 事 务 回 滚 时 ，DBMS 会 将 “前 面 ”的 图 像 复 制 到 事务 开始 后 对 数据 库 所 做 的 每 一 次 修改 。 


在 恢复 场景 中 ，DBA 可 以 使 用 事务 日 志 来 恢复 数据 库 。 首 先 ， 恢 复数 据 库 的 一 个 备份 副本 ， 接 下 来 也 可 以 恢复 后 续 的 事务 
日 志 备份 。 这 会 导致 事务 日 志向 前 滚动 。 前 滚 期 间 ，DBMSs 将 每 次 修改 “后 面 ”的 图 像 复制 到 数据 库 。 使 用 记录 的 数据 ，DBMS 
可 以 确保 每 次 修改 应 用 的 顺利 都 与 其 最 初 发 生 时 一 样 。 


在 恢复 场景 中 ，DBA 可 以 使 用 事务 日 志 来 恢复 数据 库 。 


由 此 可 以 看 到 ， 事 务 日 志 在 预防 数据 库 或 事务 错误 以 及 确保 数据 的 完整 性 方面 的 作用 巨大 。 


数据 库 日 志 配置 注意 事项 


数据 库 日 志 的 配置 可 以 是 一 项 复杂 的 任务 。 根 据 DBM s 的 不 同 ，DBA 可 能 需要 进行 多 项 配置 决策 来 建立 数据 库 事务 日 志 ， 例 
如 ， 定 义 输入 和 输出 缓冲 区 、 建 立 日 志 印 载 和 定义 实际 的 日 志文 件 。 


为 数据 库 日 志 定 义 输出 缓冲 区 可 以 优化 日 志 的 写 操作 。 将 日 志 记录 写 入 内 存 而 不 是 直接 写 入 磁盘 ， 可 以 创建 更 高 效 的 数据 库 
处 理 。DBMS 可 以 将 日 志 记 录 从 输出 缓冲 区 异步 写 入 物理 的 日 志文 件 中 。 以 这 种 方式 实现 日 志 ， 数 据 库 处 理 不 需要 等 待 日 志 同 步 
写 入 磁盘 。 


为 数据 库 日 志 定义 输入 缓冲 区 可 以 优化 读 取 数 据 库 日 志 的 操作 ， 如 ROLLBACK 和 RECOVER。 
建立 双 日 志 是 一 种 好 方法 。 


当 配 置 数据 库 日 志 时 ， 建 立 双 日 志 是 一 种 好 方法 。 有 了 双 日 志 ，DBMS 可 以 将 变更 记录 到 两 个 分 开 且 彼此 独立 的 日 志文 件 
中 。 实 现 双 日 志 为 预防 任何 一 个 日 志 失 败 提供 了 双重 保障 。 日 志 失 败 的 原因 很 多 ， 包 括 设备 故障 、 媒 介 间 题 或 仅 是 粗心 大 意 。 当 
建立 双 日 志 时 ， 一定 要 将 每 个 日 志 定 义 在 独立 的 设备 和 控制 器 上 ， 从 而 将 两 个 日 志 同 时 失败 的 可 能 性 降 到 最 低 。 


另 一 个 日 志 配 置 细节 决定 了 数据 库 日 志 在 填充 时 的 处 理 方式 。 强 调 一 下 ， 实 施 细 节 取 决 于 DBMS。 一 些 DBMS 提 供 了 自动 日 
志 镍 载 。 日 志 印 载 的 过 程 是 将 活动 日 志 归 档 到 归档 日 志 ， 然 后 将 日 志 写 入 切换 到 另 一 个 新 的 活动 日 志 。 


如 果 DBMS 进 行 自 动 日 志 凶 载 ， 将 日 志 外 载 到 位 于 磁盘 而 非 磁带 上 的 归档 日 志 中 可 以 提升 性 能 。 归 档 到 磁盘 使 得 日 志 印 载 的 
过 程 更 快 ， 撤 销 和 恢复 的 过 程 也 可 以 更 快 ， 因 为 日 志 记录 在 磁盘 上 不 仅 意 味 着 /MO 更 快 ， 而 且 不 需要 等 待 磁带 的 安装 。 一 段 时 间 
以 后 ，DBA 可 以 使 用 存储 管理 系统 来 将 归档 日 志 自动 转移 到 磁带 上 。 


一 些 DBMS 需 要 明确 地 备份 数据 库 日 志 。 在 这 种 情况 下 ， 你 需要 定期 备份 事务 的 日 志 。 通 常情 况 下 ，DBMS 提 供 了 具体 的 备 
份 命 令 来 创建 事务 日 志 备 份 。 当 DBMS 完 成 日 志 的 备份 时 ， 它 还 将 截断 日 志 的 非 活动 部 分 以 腾 出 空间 。 日 志 截 断 可 以 使 DBMS 重 
用 空间 。 


当然 ， 作 为 DBA 你 需要 知道 在 用 的 每 个 DBM S 是 如 何 处 理 数 据 库 日 志 的 备份 的 。DB2 自 动 归档 事务 日 志 ，Microsoft SQL 
Server 需 要 DBA 来 备份 日 志 。 实 际 上 ，Microsoft SQL Server 提 供 了 一 些 用 于 处 理事 务 日 志 的 有 趣 功能 。 “Microsoft SQL 
Server 的 日 志 选 项 ”讨论 了 一 些 可 以 对 数据 库 日 志 的 操作 产生 影响 的 参数 。 


是 否 记录 了 所 有 的 数据 库 操作 


依据 DBMS， 可 能 不 会 记录 某 些 情况 和 某 些 命令 。 为 了 避免 事务 日 志文 件 的 快速 增长 而 造成 “空间 用 尽 ”的 情况 ，DBMS 可 
能 会 天 掉 日 志 。 例 如 ， 一些 DDL 操 作 和 数据 库 实用 程序 执行 可 能 不 会 记录 。 注 意 这 些 情况 ， 并 根据 恢复 需要 相应 地 进行 规划 。 


可 能 不 会 记录 某 些 情况 和 某 些 命令 。 
Microsoft SQL Server 的 日 志 选 项 
Microsoft SQL Server 提 供 了 一 个 可 以 影响 数据 库 日 志 行 为 的 系统 配置 参数 。 在 数据 库 级 别 ， 选 项 TRUNC LOG ON CHKPT 可 
以 进行 变更 。 使 用 名 叫 SP_DBOPTION 的 系统 程序 来 变更 数据 库 的 配置 设置 。 例 如 


EXEC SP_DBOPTION ‘pubs’, ‘trunc. log on chkpt.’, ‘false’ 


发 出 该 命令 会 导致 “pubs” 数 据 库 的 TRUNC LOG ON CHKPT 选 项 设置 成 FALSE。 要 查看 数据 库 的 所 有 当前 选项 的 列表 ， 只 
需 发 出 一 个 不 带 参 数 的 系统 程序 ， 例 如 


EXEC SP_DBOPTION pubs 


TRUNC LOG ON CHKPT 选 项 可 能 相当 危险 。 当 它 设 置 为 TURE 时 ， 每 一 个 检查 点 的 操作 都 会 导致 数据 库 日 志 的 截断 。 也 就 
是 说 ， 数 据 库 日 志 将 清空 和 重 置 ， 导 致 所 有 的 日 志 变 更 丢失 。 使 用 一 个 在 检查 点 截断 的 日志 是 无 法 恢复 数据 库 的 。 


在 应 用 程序 开发 周期 ， 你 可 以 将 TRUNC LOG ON CHKPT 选 项 设 为 TURE 来 测试 数据 库 ， 但 对 于 关键 的 生产 数据 库 是 不 可 以 
的 。 根 据 这 些 数据 的 用 户 以 及 访问 这 些 数据 的 应 用 程序 的 需求 ，DBA 需 要 知道 这 些 选 项 并 确保 它们 都 有 适当 的 设置 。 


你 还 可 以 通过 使 用 SQL Setvet 的 恢复 模块 来 控制 日 志 的 截断 。 恢 复 模块 是 一 种 数据 库 属 性 ， 控 制 着 日 志 如 何 记 录 ， 事 务 日 志 
是 否 需要 (允许) 备份 ， 以 及 可 以 使 用 什么 样 的 还 原 操作 。 有 三 个 恢复 模块 : 简单 、 完 全 和 大 容量 日 志 。 启 用 简单 恢复 模式 会 导 
致 日 志 空 间 的 自动 回收 ， 而 完全 和 大 容量 日 志 恢 复 模式 不 会 自动 截断 事务 上 日志。 


在 一 些 大 的 操作 过 程 中 ， 如 CREATE INDEX，DBMS 可 能 不 会 记录 每 一 个 新 的 页 面 。 相 反 ，DBMS 会 在 数据 库 日 志 中 记录 足 
够 的 信息 ， 以 确定 CREATE INDEX 发 生 了 ， 以 便 它 可 以 在 前 滚 期 间 重建 或 在 回 滚 期 间 删 除 。 


此 外 ， 一 些 DBMS 在 数据 库 级 别 上 提供 了 可 以 关闭 记录 某 些 类 型 处 理 的 配置 选项 。 例 如 ，Microsoft SQL Server}, 4 
SELECT INTO/BULKCOPY 数 据 库 选项 设 为 TURE 时 ， [以 下 操作 在 数据 库 的 事务 日 志 中 将 不 予 记 录 : 批量 加 载 操作 、 
TRUNCATE TABLE, BULK INSERT 和 SELECT INTO 语 句 。 这 些 操作 会 导致 数据 库 中 大 量 数据 的 变更 。 记 录 可 以 减缓 这 些 过 程 ， 
所 以 可 以 仅 为 这 些 操作 选择 禁用 记录 。 然 而 ， 因 为 这 些 操作 不 记录 在 事务 日 志 中 ，SQL Server 不 可 以 在 事务 日 志 中 使 用 
RESTORE 操 作 来 恢复 它们 。 如 果 DBMS 不 了 解 日 志 的 操作 ， 它 就 无 法 恢复 数据 。 


当然 ，SQL Server 不 是 为 了 某 些 操 作 而 禁用 日 志 记 录 的 唯一 的 DBMS。 另 一 个 例子 是 DB2 REORG 实 用 程序 ， 它 提供 了 在 重 
组 过 程 中 禁用 或 启用 日 志 记 录 的 参数 。DB2 还 提供 了 用 于 创建 无 日 志 记 录 的 表 空 间 的 选项 。 没 有 日 志 记 录 ， 这 些 对 象 就 不 能 使 用 
志 进 行 恢复 ， 所 以 除了 特定 情况 〈 例 如 ， 在 应 用 程序 处 理 过 程 中 部 署 一 个 填充 和 清空 的 队列 ) ， 应 小 心 部 署 无 日 志 记录 的 对 

象 。 


作为 DBA， 你 需要 知道 如 何以 及 何 时 使 用 DBMSs 关 闭 日 志 记 录 。 此 外 ， 还 要 记 住 无 论 何 时 关闭 日 志 记录 ， 在 无 日 志 记录 过 程 
前 后 都 必须 备份 数据 ， 以 确保 时 间 点 的 可 回收 性 。 


1 或 者 你 已 经 启用 了 批量 日 志 记 录 恢 复 模块 。 


10.2.6 ”锁定 与 争 用 
并 发 操作 ， 例 如 ， 死 锁 检 测 和 锁定 管理 器 设置 可 以 极 大 地 影响 数据 库 系 统 的 性 能 。 数 据 库 处 理 依赖 锁定 来 确保 用 户 需求 的 数 
据 的 一 致 性 ， 并 避免 在 更 新 期 间 数据 委 失 。 你 必须 平衡 并 发 与 性 能 这 二 者 。 如 果 可 能 ， 要 尽量 减少 以 下 情况 的 发 生 : 
平衡 并 发 与 性 能 的 必要 性 。 


ARETE: 一 个 应 用 程序 请 求 的 锁 已 被 另 一 个 应 用 程序 持 有 且 不 能 共享 。 被 挂 起 的 进程 会 暂时 停止 运行 ， 直 到 请 求 的 锁 变 得 
可 用 。 


: 超时 : 应 用 程序 进程 被 挂 起 的 时 间 超 过 预先 设 定 的 时 间 间 隔 而 被 连 终止 。 此 时 间 间 隔 通 常 可 以 通过 使 用 配置 参数 进行 设 


* 死 锁 : 两 个 或 更 多 的 应 用 程序 进程 持 有 某 些 资源 上 的 锁 ， 其 他 应 用 程序 也 需要 这 些 资 源 并 且 没 有 它们 这 些 程序 就 无 法 继 
续 。 死 锁 的 检测 周期 〈 即 检查 死 锁 的 时 间 间 隔 ) 也 可 以 通过 使 用 配置 参数 进行 设置 。 


访问 天 系数 据 库 时 ， 锁 定 过 程 是 相当 复杂 的 。 它 取决 于 处 理 的 类 型 、 创 建 表 时 指定 的 锁 的 大 小 、 程 序 或 SQL 语句 的 隔离 级 
别 、 数 据 访问 的 方法 以 及 DBMS 的 配置 参数 。 要 调整 数据 库 锁 定 ， 需 要 结合 系统 、 数 据 库 和 应 用 程序 。 


10.2.7 系统 目录 

系统 目录 的 物理 位 置 和 设置 都 将 对 系统 的 性 能 产生 影响 。DBA 必 须 决定 它 安装 在 哪里 ， 在 什么 类 型 的 磁盘 上 ， 以 及 分 配 多 
大 的 空间 。 通 常 在 安装 时 做 出 这 些 决定 。 

将 系统 目录 放 在 单独 的 磁盘 设备 上 。 


根据 经 验 法 则 ， 将 系统 目录 放 在 单独 的 磁盘 设备 上 ， 以 便 它 的 管理 和 调整 可 以 独立 于 其 他 应 用 程序 数据 。 如 果 可 能 ,可 以 考 
虑 将 一 个 或 两 个 磁盘 空间 全 用 来 存放 系统 目录 。 将 索引 和 表 存 放 在 单独 的 磁盘 空间 。 此 外 ， 如 果 DBMS 没 有 为 系统 目录 提供 单独 
的 数据 高 速 缓存 ， 可 以 将 系统 目录 隔离 到 它 专用 的 数据 高 速 缓存 中 。 这 样 做 更 容易 跟踪 系统 MO 与 应 用 程序 /O 的 有 效 性 。 


目录 的 其 他 名 称 


关系 DBMS 需 要 系统 目录 ， 但 根据 使 用 的 特定 的 DBMS ， 它 可 能 还 有 其 他 的 叫 法 : 
. 在 Oracle 中 ， 它 称 为 数据 字典 。 

- 在 SQL Servet 中 ， 它 称 为 系统 目录 。 

- 在 DB2 中 ， 它 称 为 DB2 目 录 或 系统 目录 。 


` 在 MySQL 中 ， 它 称 为 信息 模式 。 


当 对 系统 目录 数据 库 进行 变更 时 ， 需 要 使 用 一 些 实用 程序 如 REORG、COPY 和 RECOVER 或 文件 系统 命令 。 可 能 需要 变更 来 
增加 系统 目录 的 大 小 ， 增 加 新 的 索引 ， 或 迁移 到 DBMS 的 新 版 本 。 通 常会 提供 一 个 迁移 实用 程序 来 进行 系统 目录 的 变更 。 


DBA 应 该 使 用 系统 目录 积极 地 管理 他 们 的 数据 库 环 境 。 一 个 好 的 方法 是 积极 监测 系统 目录 中 的 数据 库 对 象 并 且 删 除 过 时 的 
对 象 。 例 如 ， 用 于 z/OS 的 DB2，IBM 在 每 一 个 新 版 本 都 提供 了 示例 表 。 数 据 库 对 象 的 名 称 内 府 入 了 DB2 的 版 本 号 。 每 一 个 新 版 
本 都 会 导致 创建 新 的 示例 表 。 安 装 上 新 版 本 之 后 ，DBA 应 将 旧 的 示例 表 删 除 。 该 建议 适用 于 所 有 未 使 用 的 数据 库 对 象 ， 不 只 示 
例 表 。 如 果 人 存在 不 再 使 用 的 表 空 间 ， 删 除数 据 库 对 象 时 可 以 释放 出 来 ， 因 为 它 消耗 了 我 们 宝贵 的 资源 (磁盘 空间 、 系 统 目 录 空 间 


等 ) 。 


尽管 可 以 使 用 SQL 直接 查询 系统 目录 表 ， 许 多 DBMS 产 品 还 是 提供 了 目录 视图 来 简化 编写 这 样 的 查询 。 


10.2.8 ”其 他 配置 选项 


每 个 DBMs 都 有 多 个 其 特有 的 配置 和 调整 选项 。DBA 要 变 成 这 些 可 用 选项 的 专家 ， 并 了 解 每 个 允许 的 设置 可 能 产生 的 影响 。 
以 下 是 一 些 可 能 会 遇 到 的 配置 选项 : 


* 谋 套 触发 器 调用 ， 有 些 DBMS 可 以 启用 和 禁止 府 套 触发 器 调用 。 讽 套 触 发 器 调用 是 指 一 个 触发 器 导致 另 一 个 触发 器 触发 。 
某 些 DBMS 可 能 提供 一 个 最 大 值 来 对 触发 器 谋 套 进行 额外 控制 。 通 过 设置 这 个 值 ，DBA 可 以 控制 多 少 级 的 谱 套 触发 器 调用 是 允许 
的 。 控 制 触发 器 可 能 会 对 性 能 产生 巨大 的 影响 。 例 如 ， 如 果 应 用 程序 已 经 达到 庶 套 触发 器 的 最 大 值 ， 那 么 以 前 所 有 触发 器 引起 的 
所 有 变更 都 需要 回 滚 。 可 能 会 造成 相当 大 的 性 能 退化 。 


` 安全 选项 ， 安 全 和 授权 功能 受 DBMS 配 置 选项 的 控制 。 某 些 DBMS 允 许 将 数据 库 安全 移交 给 外 部 安全 和 控制 软件 。 


“ 标识 值 ， 该 标识 属性 可 以 分 配给 菜 列 ， 这 样 ， 向 表 中 插入 数据 时 DBMS 就 可 以 自动 分 配 数 值 连续 的 值 。DBMS 允 许 对 池 大 


小 进行 配置 ， 从 中 获得 标识 值 。 


分布 式 数据 库 ， 为 了 配置 一 个 分 布 式 数据 库 实 施 ，DBMS 最 可 能 提供 在 不 同 地 点 连接 数据 库 的 选项 。 


10.2.9 ”一 般 性 建议 


在 配置 数据 库 环境 时 ， 要 避免 使 用 默认 值 。 如 果 没 有 指定 特定 值 ， 大 多 数 的 配置 选项 都 将 默认 使 用 预先 设 定 的 值 。 使 用 默认 
值 的 主要 问题 是 ， 它 们 几乎 从 来 都 不 是 你 的 特殊 环境 的 最 佳 选择 。 通 常 ， 一 个 好 的 做 法 是 为 每 个 配置 参数 指定 一 个 值 ， 即 使 你 想 
选择 默认 值 。 


避免 默认 的 配置 选项 。 


最 后 ,谨防 那些 可 以 改变 DBMS 行 为 的 配置 选项 。 给 配置 参数 设置 一 个 错误 的 值 也 可 能 会 造成 很 大 的 损害 。 请 考虑 以 下 参数 
以 及 它们 潜在 的 影响 : 
:Oracle 提供 了 一 个 优化 模式 参数 ， 有 两 种 选项 : 基于 成 本 和 基于 规则 的 SQL 优化 。 这 两 种 方法 都 可 以 创建 具有 不 同性 能 的 


显著 不 同 的 SQL 访问 路 径 。 站 


- Sybase 提供 了 一 个 称 为 ALLOW UPDATES 的 参数 ， 控 制 系统 目录 表 是 否 可 以 使 用 SQL 修改 。 此 选项 启用 时 ， 系 统 目 录 的 变 
更 相当 容易 。 除 非 有 Sybase 技术 支持 的 指导 ， 要 尽量 避免 使 用 。 系 统 目 录 的 变更 也 可 以 由 DBMS 本 身 驱动 ， 而 非 用 户 发 出 的 
SQL。 


- DB2 提 供 了 几 个 参数 来 控制 数据 库 操 作 的 行为 ， 如 并 行 查询 、 数 据 共享 和 动态 SQL 缓存 。 


[1] Oracle 建 烈 建议 用 户 使 用 基本 成 本 的 优化 ， 并 且 计 划 在 未 来 的 Oracle DBMS 版 本 中 弃 用 基于 规则 的 优化 。 


10.3 ”系统 监测 


应 对 DBMS 环 境 进 行 持 续 的 监测 ， 以 防 出 现 性 能 退化 和 其 他 问题 。 有 些 DBMS 提 供 了 内 置 的 监测 器 来 完成 基本 的 监测 。 此 
外 ， 还 可 以 部 署 额外 的 性 能 监测 方案 ， 如 Oracle Enterprise Manager, Quest Software 的 Foglight 或 1BM 公 司 的 
OMEGAMON, 提供 更 多 强大 的 监测 功能 ， 如 动态 报警 和 性 能 问题 的 主动 管理 。 有 关 Sybase DBMS 性 能 监测 器 的 信息 请 参 
i] “Sybase SP MONITOR” 。 


Sybase SP MONITOR 


SP_MONITOR 系 统 程序 是 由 Sybase 提供 给 其 DBMS 的 一 种 基本 工具 。 当 该 程序 运行 时 ， 根 据 以 下 面向 性 能 的 数字 显示 DBMS 
的 活动 : 


- 上 一 次 运行 : SP_MONITOR 最 后 一 次 运行 的 日 期 和 时 间 。 

当前 运行 : SP_MONITOR 运 行 产生 此 报告 的 日 期 和 时 间 。 

- 秒 : 自 上 次 运行 SP_MONITOR 的 总 秒 数 。 

- CPU 忙 : 服务 器 CPU 执行 Sybase 任务 所 花费 的 CPU 时 间 ， 以 毫秒 计 。 
IO: 服务 器 CPU 执行 Sybase IO 操作 所 花费 的 CPU 时 间 ， 以 毫秒 计 。 
. Bl: Sybase 保持 空闲 的 CPU 时 间 ， 以 毫秒 计 。 

. 接收 数据 包 : 由 Sybase 读 取 的 输入 数据 包 的 数量 。 

: 发 出 数据 包 : 由 Sybase 发 出 的 输出 数据 包 的 数量 。 

- 数据 包 错 误 : 读 取 和 写 入 数据 包 时 ，Sybase 检 测 到 的 错误 的 数量 。 

. 总 读 取 : Sybase 执行 的 磁盘 读 取 的 数量 。 

. BBA: Sybase 执行 的 磁盘 写 入 的 数量 。 

. RRA: 读 取 和 写 入 时 ，Sybase 检 测 到 的 错误 的 总 数 。 

“ 连接 : 登录 或 试图 登录 Sybase 的 次 数 。 

这 些 数字 是 可 以 累加 到 SP_MONITOR 上 次 执行 的 数字 中 的 。 


性 能 监测 器 可 用 于 系统 环境 的 各 个 方面 ， 而 不 仅仅 是 DBMS， 所 以 你 可 以 监测 操作 系统 、 网 络 和 任何 其 他 系统 中 间 件 的 性 能 


问题 。DBA 必 须 能 够 操作 并 了 解 现 有 的 监测 解决 方案 的 输出 。 性 能 监测 器 充当 了 数据 库 系 统 的 效率 (或 缺乏 ) 的 一 个 窗口 。 


性 能 监测 器 充当 了 数据 库 系 统 的 效率 的 一 个 窗口 。 


10.4 je 


如 果 DBMS 的 运行 环境 不 能 有 效 运行 ，DBMS (事实 上 ， 任 何 数据 库 访问 ) 也 不 可 能 有 效 运行 。DBA 需 要 了 解 DBMS 的 每 个 
配置 值 及 其 对 系统 整体 性 能 的 影响 。 此 外 ，DBA 必 须 控制 DBMS 和 任何 联合 代理 软件 及 其 得 以 运行 的 硬件 的 集成 。 


10.5 ”回顾 


1. 什 么 是 关系 数据 库 管 理 系统 最 重要 的 配置 组 件 ? 

2 .数据 高 速 缓存 (或 缓冲 池 ) 是 如 何 提升 数据 库 处 理 的 性 能 的 ? 
3. 请 描述 如 何 确定 数据 高 速 绥 存 的 读 取 效率 。 

4.DBMS 的 什么 组 件 需 要 系统 内 存 控制 ? 

5. 哪 三 个 并 发 问题 可 以 对 性 能 产生 负面 影响 ? 

6. 为 什么 某 些 数据 库 操作 不 会 记录 ? 

7.DBMS 由 多 个 相互 作用 的 程序 组 成 ， 这 种 说 法 是 否 正 确 ? 

8. 页 面 在 数据 高 速 缓存 中 有 哪 三 种 可 能 的 状态 ? 

9. 在 内 存 缓存 优化 的 SQL 有 哪些 好 处 ? 


10. 数 据 库 事务 日 志 中 可 以 记录 哪 种 类 型 的 信息 ? 


附加 问题 


对 于 一 个 不 予 记 录 的 数据 库 操 作 ，DBA 应 在 该 操作 前 后 采取 什么 预防 措施 ”为 什么 ? 
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第 11 章 ”数据 库 性 能 


数据 库 性 能 侧重 于 调整 和 优化 数据 库 对 象 的 设计 、 参 数 和 物理 结构 ， 特 别 是 表 、 索 引 和 存储 数据 的 文件 。 如 果 数 据 库 的 效率 
低下 ， 必 须要 对 数据 库 对 象 的 实际 组 成 和 结构 进行 连续 监测 并 作出 相应 的 变更 。 对 于 一 个 设计 不 佳 或 杂乱 无 章 的 数据 库 ， 即 使 再 
大 的 SQL 调整 或 系统 调整 也 不 可 能 优化 针对 其 运行 的 查询 的 性 能 。 


对 于 一 个 设计 不 佳 的 数据 库 ， 即 使 再 大 的 SQL 调整 或 系统 调整 也 不 可 能 优化 针对 其 运行 的 查询 的 性 能 。 


11.1 优化 数据 库 的 技术 


DBA 必 须 认 识 到 DBMS 的 特性 ， 以 便 应 用 合适 的 技术 来 优化 数据 库 结构 的 性 能 。 大 多 数 主要 的 DBMS 都 支持 以 下 技术 ， 尽 管 
名 称 可 能 会 不 同 。 以 下 技术 都 可 用 来 调整 数据 库 的 性 能 ， 将 在 随后 的 章节 中 进行 讨论 。 


* 分 区 : 将 单个 数据 库 表 格 分 解 成 存储 于 多 个 文件 的 部 分 。 

* 原始 分 区 与 文件 系统 : 选择 是 否 将 数据 库 数 据 存储 在 ODS 控制 的 文件 中 。 
索引: 选择 合适 的 索引 和 选项 ， 以 实现 高 效 查询 。 

* 非 规范 化 : 与 逻辑 设计 不 同 ， 以 实现 更 好 的 查询 性 能 。 

o 集群 : 强制 执行 磁盘 上 数据 的 物理 顺序 。 

. 交叉 数据 : 将 来 自 多 个 表 的 数据 组 合成 单一 、 顺 序 的 文件 。 
TAZA: 为 数据 增长 预 留 空间 。 

“ 压缩: 算法 上 减少 存储 需求 。 

* 文件 放置 和 分 配 : 将 对 的 文件 放 在 对 的 地 方 。 

-页面 大 小 : 为 了 高 效 的 数据 存储 和 I/O 使 用 适当 的 页 面 大 小 。 


. 重组 : 通过 重新 调整 和 重组 数据 库 对 象 来 消除 数据 库 的 低 效率 。 


11.1.1 分 区 


数据 库 表 是 一 种 物理 驻 留 在 电脑 存储 中 的 数据 的 逻辑 表现 形式 。DBA 必 须 为 每 张 表 做 的 决定 之 一 是 如 何 存储 这 些 数 据 。 每 
个 DBMS 都 提供 了 不 同 的 机 制 来 完成 同样 的 事情 (将 物理 文件 映射 到 数据 库 表 ) 。DBA 必 须 为 每 张 表决 定 以 下 映射 选项 : 


DBA 必 须 为 每 张 表 决定 如 何 存 储 数据 。 


- 单 张 表 到 单个 文件 。 到 目前 为 止 ， 这 是 最 常见 的 选择 。 格 式 化 文件 中 的 数据 使 DBMS 了解 表 的 结构 以 及 插入 表 的 每 一 行 都 


存储 在 同一 个 文件 中 。 然 而 ， 该 设置 并 不 一 定 是 最 高 效 的 。 


- 单 张 表 到 多 个 文件 。 此 选项 最 常用 于 非常 大 的 表 或 要 求 数据 在 存储 级 别 进行 物理 分 离 的 表 。 通 过 使 用 分 区 表 空 间或 实施 分 
段 磁盘 设备 可 以 实现 到 多 个 文件 的 映射 。 


.多 张 表 到 单个 文件 。 该 类 型 的 映射 用 于 小 表 〈 如 查找 表 和 代码 表 ) ， 并 且 从 磁盘 利用 率 的 角度 来 看 ， 该 映射 更 加 有 效 。 


分 区 有 助 于 实现 并 行 性 。 并 行 性 是 多 个 任务 并 行 访问 数据 库 的 过 程 。 单 个 SQL 语句 可 以 调用 一 个 并 行 请 求 ， 以 使 用 多 个 同时 
进行 读 取 的 引擎 。 并 行 性 是 可 取 的 ， 因 为 它 可 以 大 大 减少 数据 库 查询 所 用 的 时 间 。 

分 区 有 助 于 实现 并 行 性 。 

多 种 类 型 的 并 行 性 基于 可 以 并 行 调 用 的 资源 。 例 如 ， 单 个 查询 可 以 分 解 成 多 个 请 求 ， 每 个 请 求 都 使 用 不 同 的 并 行 CPU 内 核 


[1。 此 外 ， 跨 越 多 个 数据 库 实例 分 散 工作 可 以 提升 并 行 性 。 为 了 优化 数据 库 性 能 ，DBA 应 认识 到 每 个 受 管理 的 DBMS 提 供 的 支 
持 ， 并 利用 并 行 查询 功能 。 


[1] 多 核 处 理 器 是 具有 两 个 或 两 个 以 上 独立 实际 处 理 器 (内 核 ) 的 单个 计算 组 件 。 


11.1.2 原始 分 区 与 文件 系统 


对 于 基于 UNIX 的 DBMS 环 境 ， [DBA 必 须 在 原始 分 区 和 使 用 UNIX 文 件 系 统 在 数据 库 中 存储 数据 之 间 做 出 选择 。 原始 分 
区 是 用 于 数据 库 人 存储 的 物理 设备 类 型 的 首选 ， 因 为 使 用 文件 系统 时 写 入 会 被 操作 系统 缓 仔 。 当 操作 系统 缓冲 写 入 时 ，DBM 不 知 
道 该 数据 是 否 已 物理 复制 到 磁盘 。 此 时 ，DBMS 缓 仓 管理 器 试图 将 数据 写 入 磁盘 ， 操 作 系统 可 能 会 延迟 写 入 ， 因 为 数据 可 能 仍 在 
文件 系统 的 缓存 中 。 如 果 发 生 故 障 ， 使 用 文件 系统 存储 的 数据 库 中 的 数据 可 能 无 法 100% 恢 复 。 这 是 要 避免 的 。 


相反 ， 如 果 使 用 原始 分 区 ， 数 据 直 接 从 数据 库 缓存 写 入 磁盘 ， 且 没有 中 间 文 件 系统 或 操作 系统 缓 仔 ， 如 图 11-1 所 示 。 
DBMS 缓 存 管理 器 将 数据 写 入 磁盘 时 ， 可 以 毫 无 妨碍 地 物理 写 入 磁盘 。 此 外 ， 使 用 原始 分 区 ，DBM 将 确保 有 足够 的 空间 写 入 分 
配 的 页 面 ; 使 用 文件 系统 ， 操 作 系统 则 不 会 预先 分 配 数 据 库 使 用 的 空间 。 


MARA 
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图 11-1 使 用 原始 分 区 避免 文件 系统 缓存 


从 性 能 的 角度 来 看 ， 在 文件 系统 或 操作 系统 级 别 拥有 次 生 层 缓存 没有 任何 优势 。 实 际 上 ， 第 二 次 缓存 数据 会 消耗 资源 ， 从 而 
对 数据 库 操 作 的 整体 性 能 产生 负面 的 影响 。 


从 性 能 角度 来 看 ，DBMS 缓 存 是 充足 的 。 


[l] 原始 分 区 也 可 以 在 Windows 环 境 中 创建 ， 只 是 非常 少见 。 


11.1.3 索引 
在 数据 库 中 创建 表 的 正确 索引 或 许 是 DBA 可 以 执行 的 单个 最 大 性 能 调整 技术 。 索 引 可 用 来 提高 性 能 。 它 们 对 以 下 方面 特别 
有 用 : 
“ 由 列 的 值 来 定位 行 。 
. 使 连接 更 加 高 效 〈 当 索引 定义 在 连接 列 时 ) 。 
. 跨 表 关联 数据 。 
“ 聚合 数据 。 


+ 对 数据 进行 排序 以 满足 查询 的 需要 。 


索引 可 用 来 提高 性 能 。 
没有 索引 ， 数 据 库 中 数据 的 所 有 访问 都 必须 扫描 所 有 的 可 用 行 。 大 表 的 扫描 效率 是 非常 低 的 。 


设计 和 创建 数据 库 表 的 索引 实际 上 跨越 了 数据 库 性 能 调整 和 应 用 程序 性 能 调整 之 间 的 界线 。 索 引 是 由 DBA 使 用 数据 库 的 
DDL 创 建 的 数据 库 对 象 。 然 而 ， 建 立 索 引 是 为 了 让 应 用 程序 中 的 SQL 运行 得 更 快 。 作 为 一 种 调整 手段 ， 索 引 应 用 于 数据 库 ， 在 应 
用 程序 的 数据 访问 模式 与 数据 库 设 计 之 初 的 预期 有 所 不 同时 ， 它 可 以 使 应 用 程序 更 加 高 效 。 


在 创建 新 的 索引 调整 数据 库 之 前 ， 一 定 要 了 解 添加 新 的 索引 将 会 产生 的 影响 。DBA 应 了 解 建立 索引 的 表 的 访问 模式 。 其 中 
有 用 的 信息 包括 : 访问 而 非 更 新 表 时 查询 的 百分比 ， 表 中 任何 用 于 查询 的 服务 级 别 协议 的 性 能 阅 值 的 设置 ， 以 及 在 运行 的 数据 库 
实用 程序 (如 加 载 、 重 组 和 恢复 ) 中 添加 新 的 索引 的 影响 。 


数据 库 设 计 的 一 个 大 的 悬而未决 的 问题 是 “对 于 单个 表 ， 应 创建 多 少 个 索引 ” ”这 个 问题 没有 固定 的 答案 。DBA 需 要 利用 
他 们 的 专业 知识 来 决定 每 张 表 的 索引 的 合适 数目 ， 这 样 ， 数 据 库 的 查询 也 可 以 得 到 优化 ， 且 数据 库 插 入 、 更 新 和 删除 的 性 能 也 不 
会 降低 。 而 决定 每 张 表 的 索引 的 合适 数目 需要 对 数据 库 和 访问 该 数据 库 的 应 用 程序 进行 深入 的 分 析 。 


索引 分 析 的 总 体 目标 是 使 用 较 少 的 数据 库 I/O 来 满足 对 表 的 查询 。 当 然 ， 索 引 可 以 帮助 一 些 查询 ， 同 时 妨碍 另 一 些 查询 。 
此 ，DBA 必 须要 对 所 有 的 应 用 程序 都 添加 一 个 索引 的 影响 进行 评估 ， 而 不 是 仅 赁 空调 整 单个 查询 。 这 是 一 项 艰巨 却 很 有 价值 的 
任务 。 


当 使 用 较 少 的 MO 就 可 以 返回 查询 结果 时 ， 索 引 将 对 性 能 产生 积极 的 影响 。 相 反 ， 当 数据 更 新 而 索引 也 不 得 不 进行 变更 时 ， 
索引 的 影响 将 是 消极 的 。 一 个 有 效 的 索引 策略 旨 在 尽 最 大 的 努力 减少 MO 以 保持 索引 的 更 新 。 


某 些 有 复杂 查询 的 应 用 程序 需要 进行 重大 的 调整 以 达到 满意 的 性 能 。 如 果 有 查询 在 业务 的 ROI 方 面 足够 重要 (或 者 该 业务 由 
你 的 老板 或 CEO 杀 自 经 营 ) ， 创 建 一 个 索引 来 支持 该 查询 也 是 可 取 的 。 如 果 该 查询 不 常 运行 ， 可 以 考虑 在 查询 开始 前 创建 索 
引 ， 而 在 查询 完成 后 再 删除 索引 。 


当 创 建新 的 索引 时 ， 一 定 要 对 它 支持 的 查询 的 性 能 进行 彻底 的 测试 。 此 外 ， 还 要 对 数据 库 修改 语句 进行 测试 ， 以 了 解 更 新 这 
些 新 的 索引 的 额外 开销 。 对 CPU 时 间 、 经 过 时 间 和 I/O 需 求 进行 审查 以 确保 这 些 索 引 有 用 。 记 住 ， 调 整 是 个 迭代 过 程 ， 可 能 需要 
一 段 时 间 和 若干 个 索引 的 调整 才能 确定 一 个 变更 的 影响 。 创 建 索引 没有 既定 规则 ， 可 以 尝试 不 同 的 索引 组 合 来 检验 结果 。 


有 关 常 用 的 DBMS 支 持 的 索引 结构 和 索引 类 型 的 其 他 信息 ， 请 参阅 第 4 章 索 引 设计 的 部 分 。 
一 定 要 对 索引 支持 的 查询 的 性 能 进行 彻底 的 测试 。 
何 时 避免 使 用 索引 


有 些 情况 下 使 用 索引 可 能 不 是 个 好 主意 。 表 非常 小 ， 即 小 于 十 个 页 面 时 ， 可 以 考虑 避免 使 用 索引 。 小 表 的 索引 访问 可 能 比 简 
单 扫描 所 有 的 行 效率 更 低 ， 因 为 读 取 索引 增加 了 I/O 请 求 。 例 如 ，SQL Server 就 一 直 对 小 于 64K ( 八 个 页 面 ) 的 表 执 行 扫描 。 


尽管 索引 |/O， 即 使 一 张 小 表 有 时 也 可 以 受益 于 索引 。 例 如 ， 强 制 唯一 性 或 大 多 数 的 数据 访问 只 通过 主 码 检索 单个 行 时 使 
用 。 


你 可 能 希望 避免 可 变 长 度 列 的 索引 ， 如 果 有 问题 的 DBMS 将 可 变 列 扩展 到 索引 的 最 大 长 度 。 这 种 扩展 可 能 会 导致 索引 消耗 的 
磁盘 空间 过 多 并 且 效 率 低 下 。 然 而 ， 如 果 可 变 长 度 列 用 于 SQL 的 WHERE 子 句 ， 磁 盘存 储 的 成 本 一 定 可 以 与 扫描 的 成 本 相 比较 。 
购买 额外 的 磁盘 存储 通常 比 浪费 CPU 资 源 来 扫描 行 更 划算 。 此 外 ，SQL 查 询 可 能 包含 可 以 索引 的 替代 谓词 取代 的 可 变 长 度 列 。 有 
些 DBMS 支 持 索引 压缩 ， 它 可 以 用 来 减少 索引 的 存储 需求 。 索 引 压 缩 的 优 缺 点 与 那些 已 经 讨论 过 的 表 和 表 空 间 压缩 的 优 缺 点 类 


似 。 


值 的 个 数 非常 少 的 列 (通常 称 作 基 数 ) 也 要 避免 使 用 索引 。 只 有 几 个 值 时 ， 索 引 不 是 特别 有 用 ， 并 且 可 能 成 为 维护 的 瓶颈 。 
GENDER (性 别 ) 就 是 一 个 具有 很 少 不 同 值 的 列 的 例子 。 


此 外 ， 任 何 一 直 使 用 扫 摘 访问 的 表 也 要 避免 素 引 。 也 就 是 说 ， 对 表 发 出 的 SQL 从 不 包含 WHERE 子 句 。 


任何 一 直 使 用 扫描 访问 的 表 要 避免 索引 。 


索引 重 载 


在 某 些 情况 下 ， 使 用 额外 的 列 重 载 索 引 可 以 提升 查询 的 性 能 。 通 常 索 引 基于 SQL SELECT 语句 的 WHERE 子 句 。 例 如 ， 考 虑 
以 下 SQL 语句 : 


select emp_no, last_name, salary 
from employee 
where salary > 15000.00; 


在 Salary (工资 ) 列 上 创建 索引 可 以 提升 该 查询 的 性 能 。 然 而 ，DBA 也 可 以 通过 重 载 列 emp_no 和 last name 来 进一步 提升 
查询 的 性 能 。 有 了 重 载 索引 ，DBMS 可 以 仅 使 用 该 索引 满足 查询 。DBMS 不 会 带 来 额外 1/6 的 表 数 据 的 访问 ， 因 为 每 一 个 查询 所 
需 的 数据 都 在 重 载 的 索引 中 存在 。 


当 多 个 查询 可 以 受益 于 索引 或 单个 查询 非常 重要 时 ，DBA 应 考虑 重 载 索 引 以 鼓励 索引 访问 。 


11.1.4 JEDNE 


优化 数据 库 访 问 性 能 的 另 一 种 方式 是 将 表 进 行 非 规范 化 。 非 规范 化 已 经 在 第 4 章 有 过 详细 的 介绍 。 在 此 就 不 作 深 入 讨论 
了 。 非 规范 化 (与 规范 化 相反 ) 是 一 种 将 一 个 事实 放 在 许多 地 方 的 过 程 。 这 种 数据 检索 的 加 速 是 以 修改 数据 为 代价 的 。 当 完全 规 
范 化 的 设计 执行 不 佳 时 ， 非 规范 化 表 可 能 是 个 不 错 的 决定 。 


非 规范 化 关系 数据 库 设计 的 唯一 目的 是 提升 性 能 。 

曾经 非 规范 化 关系 数据 库 设 计 的 唯一 目的 是 提升 性 能 。 正 如 第 4 章 所 讨论 的 ， 应 考虑 以 下 选项 : 
. 预 连接 表 : 当 连 接 的 成 本 过 于 高 昂 时。 

HER: 当 专 门 的 关键 性 的 报告 产生 成 本 过 高 时 。 

镜像 表 : 当 两 种 环境 同时 需要 表 时 。 

Bala: 当 不 同 的 组 使 用 表 的 不 同 部 分 时 。 

WSR: 为 了 将 一 对 一 或 一 对 多 的 关系 合并 到 单个 表 。 

. 加 速 表 : 为 了 支持 材料 清单 或 报告 结构 的 层次 。 


.物理 非 规范 化 : 为 了 利用 特定 的 DBMS 特性 。 


还 可 以 考虑 : 


. 在 表 中 存储 宛 余 数据 以 减少 表 连 接 的 数量 。 


- 在 行 中 存储 重复 的 组 以 减少 I/O 和 可 能 的 磁盘 空间 。 


> 存储 可 导数 据 以 消除 计算 和 昂贵 的 莫 法 。 


11.1.5 集群 


集群 表 的 行 以 指定 的 一 列 或 多 列 的 顺序 物理 存储 在 磁盘 上 。 集 群 通常 由 DBM 9 强制 添加 一 个 集群 索引 。 集 群 索 引 人 迫使 表 的 行 
以 索引 列 的 升序 存储 。 列 从 左 到 右 的 顺序 (如 同 索引 中 定义 的 一 样 ) 定义 了 集群 索引 的 排序 序列 。 每 张 表 只 能 有 一 种 集群 序列 
(因为 数据 只 能 以 一 种 序列 进行 物理 存储 ) 。 


集群 表 的 行 以 指定 的 一 列 或 多 列 的 顺序 物理 存储 在 磁盘 上 。 


图 11-2 演 示 了 集群 和 非 集群 的 数据 和 索引 之 间 的 差异 。 集 群 索 引 在 上 ， 非 集群 索引 在 下 。 正 如 你 看 到 的 ， 顶 部 索引 的 叶 级 
页 的 入 口 是 按 顺序 排列 的 ， 换 句 话说 ， 它 们 是 集群 的 。 集 群 提升 了 顺序 访问 数据 的 查询 的 性 能 ， 因 为 检索 同样 的 数据 需要 发 出 的 
1/O 较 少 。 


集群 
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图 11-2 ”集群 和 非 集群 索引 


根据 DBMS， 数 据 可 能 并 不 总 是 以 精确 的 集群 序列 进行 物理 维护 的 。 表 的 集群 序列 定义 好 之 后 ，DBMS 将 用 以 下 这 两 种 方法 
中 的 一 种 强制 执行 集群 : 


1. 插 入 新 行 时 ，DBMS 将 物理 操纵 数据 的 行 和 页 面 ， 使 新 行 适应 定义 好 的 集群 序列 。 


2. 插 入 新 行 时 ，DBMS 将 尝试 把 数据 放 入 定义 好 的 集群 序列 ， 但 是 如 果 在 所 需 页 面 没 有 可 用 的 空间 ， 数 据 可 能 会 放 到 别 的 地 
方 。 


DBA 必 须 学 会 DBMS 维 护 集群 的 方法 。 如 果 DBMS 的 操作 如 第 二 种 情况 ， 数 据 可 能 会 随时 间 变 成 非 集群 并 且 需 要 进行 重组 。 
有 关 数 据 库 重组 的 详细 讨论 将 在 本 章 后 面 进行 。 现 在 继续 讨论 集群 。 


按 顺 序 访问 的 集群 表 是 个 不 错 的 做 法 。 换 句 话说 ， 集 群 索 引 有 益 于 支持 一 定 学 围 内 的 访问 ， 而 非 集群 索引 则 更 支持 随机 访 
问 。 集 群 列 的 选择 一 定 要 明智 。 在 下 列 情况 下 使 用 集群 索引 : 


- 连接 列 : 为 了 优化 SQL 连接 ， 其 中 多 个 行 与 参与 该 连接 的 一 个 或 两 个 表 相 匹配 。 
SPSS: 因为 它们 经 常 涉及 连接 ， 以 及 声明 引用 完整 性 检查 期 间 DBMS 访 问 外 码 的 值 。 


. WHERE 子 句 中 的 谓词 。 


范围 列 。 

RAR RES) (By wes RA). 
- 在 SQL 语句 中 频繁 分 组 或 排序 的 列 。 

按 顺序 访问 的 集群 表 是 个 不 错 的 做 法 。 


一 般 情 况 下 ， 对 最 经 常 访 问 的 谓词 的 性 能 有 帮助 的 集群 序列 应 用 作 集 群 。 表 有 多 个 候选 集群 时 ， 对 每 个 候选 码 的 排序 成 本 以 
及 通过 集群 获得 的 性 能 进行 权衡 。 尽 管 如 此 ， 作 为 一 个 经 验 法 则 ， 如 果 DBMS 支 持 集群 ， 通 常 一 种 好 的 做 法 是 为 每 个 已 创建 的 表 
都 定义 集群 索引 (除非 该 表 非 常 小 ) 。 


主 码 列 通常 不 推荐 集群 ， 因 为 主 码 是 唯一 的 (根据 定义 ) 。 但 是 ， 如 果 行 的 范围 经 常 需要 根据 主 码 的 值 进行 选择 和 排序 ， 集 
群 索引 可 能 是 有 益 的 。 
分 页 


当 DBM 不 得 不 容纳 插入 却 没有 空间 时 ， 它 必须 在 数据 库 中 创建 新 页 来 存储 新 的 插入 数据 。 创 建新 页 来 存储 插入 数据 的 过 程 
叫做 分 页 。 一 个 DBMS 可 以 执行 两 种 类 型 的 分 页 : 正常 的 分 页 和 单调 的 分 页 。 有 些 DBMS 支 持 这 两 种 类 型 分 页 ， 而 有 些 仅 支 持 一 
种 。DBA 需 要 知道 ,为 了 优化 数据 库 '，DBMS 是 如 何 实现 分 页 的 。 


创建 新 页 来 存储 插入 数据 的 过 程 叫做 分 页 。 

图 11-3 描 绘 了 正常 的 分 页 ， 要 做 到 这 一 点 ，DBMS 需 依次 执行 下 列 任务 : 
1. 在 填 满 的 页 面 和 下 一 个 页 面 之 间 创 建新 的 空白 页 面 ; 

2. 将 填 满 页 面 中 一 半 的 条 目 转移 到 空白 页 面 ; 

3. 调 整 两 个 页 面 的 内 部 指针 ， 并 相应 地 插入 行 。 

单调 的 分 页 过 程 更 简单 ， 只 需要 两 步 。DBMS 

1. 在 填 满 的 页 面 和 下 一 个 页 面 之 间 创 建新 的 页 面 ; 
2. 向 新 的 页 面 插入 新 值 。 


一 一 插入 


aii (页 面 没 有 空间 ) 


| 


新 的 1/2 满 页 
满 页 
图 11-3 正常 的 分 页 


当 行 插入 严格 的 升序 序列 时 ， 单 调 的 分 页 很 有 用 。 


= 


新 的 1/2 满 页 


通常 情况 下 ， 有 新 行 添加 到 页 面 末 尾 并 且 上 次 添加 也 在 页 面 未 尾 时 ,支持 


单调 分 页 的 DBM 将 调用 新 行 。 


有 升序 行 插入 并 且 使 用 了 正常 分 页 时 ， 将 会 浪费 大 量 的 空间 ， 因 为 DBM 3 会 创建 半 满 的 页 面 且 永 远 不 会 填 满 。 如 果 在 数据 库 
处 理 过 程 中 使 用 了 错误 的 分 页 ， 浪 费 空 间 在 所 难免 ， 为 了 性 能 还 需要 对 数据 库 对 象 进行 重组 。 


11.1.6 交叉 数据 


如 果 两 个 表 的 数据 连接 频繁 ， 将 数据 物理 交错 成 相同 的 物理 存储 结构 就 很 有 意义 了 。 这 可 以 看 作 集 群 的 一 种 特殊 形式 (实际 
上 ，Oracle 使 用 术语 “和 集群 ”来 定义 交叉 数据 ) 。 交 叉 数 据 在 第 4 章 中 有 所 涵盖 ， 这 里 再 次 提 到 的 是 作为 一 种 性 能 调整 技术 来 考 
虑 的 。 


交叉 可 以 看 作 集 群 的 一 种 特殊 形式 。 


11.1.7 可 用 空间 


可 用 空间 (有 时 也 叫 填 充 因子 ) 用 来 保持 一 部 分 表 空间 或 索引 为 空 ， 用 于 存储 新 添加 的 数据 。 规 范 表 空 间或 索引 的 可 用 空间 
可 以 减少 重组 的 频率 ， 减 少 争 用 并 且 提 升 插入 的 效率 。 每 个 DBMS 都 提供 了 一 种 方法 ， 用 于 在 CREATE 和 ALTER 语 句 中 为 数据 库 
对 象 指定 可 用 空间 。 一 个 典型 的 参数 是 PCTFREE，DBA 可 以 用 它 指定 每 个 页 面 为 将 来 的 插入 而 保留 的 可 用 空间 的 百分比 。 另 一 
种 可 能 的 参数 是 FREEPAGE，DBA 可 以 用 它 指定 多 少 个 页 面 之 后 ， 是 个 完全 空白 的 页 面 。 


为 每 个 数据 库 对 象 确保 适量 的 可 用 空间 的 好 处 如 下 : 

SATA SMA, HARK. 

- 当 有 新 行 插入 时 ， 它 们 可 以 适当 地 进行 集群 。 

* 可 变 长 度 的 行 和 修改 的 行 有 了 扩展 的 空间 ， 潜 在 地 减少 了 重新 定位 行 的 次 数 。 

:一 个 页 面 的 行 减少 可 以 获得 更 好 的 并 发 性 ， 因 为 一 个 页 面 被 其 他 用 户 锁定 时 ， 不 可 用 的 数据 更 少 。 
为 每 个 数据 库 对 象 确保 适量 的 可 用 空间 。 

然而 ， 可 用 空间 也 有 一 些 缺 点 : 

-磁盘 存储 的 要 求 更 高 。 

扫描 需要 的 时 间 更 长 。 

* 页 面 上 较 少 的 行 可 能 需要 更 多 的 1/ 〇 操作 来 访问 请 求 的 信息 。 

" 因为 每 个 页 面 行 的 数目 减少 了 ， 每 次 1/O 〇 检索 的 行 减少 了 ， 所 以 数据 缓存 的 效率 也 降低 了 。 

DBA 应 对 可 用 空间 进行 监测 ， 并 且 确 保 每 个 数据 库 对 象 都 定义 了 适量 的 空间 。 可 用 空间 适量 与 否 ， 基 于 以 下 几 个 方面 : 


` 插入 和 修改 的 频率 。 


* 顺序 访问 和 随机 访问 的 次 数 。 
访问 非 集群 数据 的 影响 。 

“ 处 理 类 型 。 

* 行 链接 、 行 迁移 和 分 页 的 可 能 性 。 


不 要 为 静态 表 定 义 可 用 空间 ， 不 需要 扩展 的 空间 。 


11.1.8 压缩 
压缩 可 用 于 缩小 数据 库 的 规模 。 数 据 压 缩 时 ， 数 据 库 需要 的 磁盘 存储 相对 较 少 。 有 些 DBM 提供 了 内 部 DDL 选 项 来 压缩 数据 
库 文 件 ， 如 果 没 有 压缩 的 功能 ， 也 可 以 通过 第 三 方 软件 实现 。 


指定 了 压缩 ， 数 据 插 入 数据 库 时 使 用 算法 压缩 ， 读 取 时 进行 解压 缩 。 读 取 和 写 入 压缩 的 数据 比 读 取 和 写 入 未 压缩 的 数据 消耗 
的 CPU 资 源 更 多 ， 因 为 用 户 插 入 、 更 新 和 读 取 数据 时 ，DBMS 必 须 执行 代码 对 数据 进行 压缩 和 解压 缩 。 


那么 ， 为 什么 要 压缩 数据 ?考虑 一 个 行 大 小 为 800B 且 未 压缩 的 表 ， 一 个 4K 的 页 面 (或 块 ) 只 存放 五 行 。 如 果 将 数据 进行 压 
缩 ， 情 况 会 是 什么 样 ” 假 设 压缩 程序 平均 达到 30% 的 压缩 率 (非常 保守 的 估计 ) 。 这 种 情况 下 ，800B 的 行将 只 消耗 
560B (800x (1-0.3) =560) 。 数 据 压 缩 之 后 ，4K 的 页 面 可 以 人 存放 七 行 。 由 于 MO 发 生 在 页 面 级 别 ， 单 次 /O 将 获取 更 多 的 数 
据 ， 这 将 优化 顺序 数据 扫描 的 性 能 并 且 增 加 数据 驻 留 缓 存 的 可 能 性 ， 因 为 一 个 物理 页 存放 的 行 增多 了 ，。 


当然 ， 是 否 压 缩 需 要 DBA 进 行 权衡 。 从 积极 的 方面 来 看 ， 节 省 了 磁盘 空间 ， 并 且 可 能 降低 了 IO 的 成 本 ; 另 一 方面 ， 压 缩 和 
解压 数据 都 需要 额外 的 CPU 成 本 。 


是 否 压缩 通常 需要 权衡 ， 但 对 于 I/O 频 繁 的 系统 是 值得 的 。 


然而 ， 压 缩 并 不 是 每 个 数据 库 索 引 或 表 的 选择 。 对 于 较 小 的 数据 量 ， 压 缩 文件 可 能 比 未 经 压缩 的 文件 更 大 。 这 是 因为 有 些 
DBMS 和 压缩 算法 需要 一 个 内 部 词典 来 管理 。 词 典 包括 被 压缩 数据 组 成 的 统计 信息 。 对 于 小 量 的 数据 ， 词 典 的 大 小 可 能 比 压缩 后 
保留 的 数据 还 要 大 。 


11.1.9 ”文件 放置 与 分 配 


包含 数据 库 数 据 的 文件 的 位 置 可 能 会 对 性 能 产生 影响 。 数 据 库 的 MO 非 常 密 集 ，DBA 必 须 尽 一 切 努 力 来 减少 物理 磁盘 的 读 写 
成 本 。 


DBA 必 须 尽 一 切 努 力 来 减少 物理 磁盘 的 读 写 成 本 。 


. 了 解 与 系统 中 每 段 数 据 相关 的 访问 模式 。 


: 向 物理 磁盘 设备 放置 数据 时 ， 本 着 优化 性 能 的 原则 。 


如 果 可 能 ， 文 件 在 磁盘 上 放置 首先 要 考虑 的 是 索引 与 数据 分 离 。 数 据 库 查询 通常 需要 访问 表 以 及 表 的 索引 的 数据 。 如 果 这 两 
个 文件 驻 留 在 同一 个 磁盘 设备 ， 性 能 可 能 会 降低 。 为 了 从 磁盘 检索 数据 ， 读 写 辟 需要 移动 到 磁盘 读 取 磁 盘 上 的 数据 物理 块 。 如 果 
这 个 磁盘 上 同时 还 存在 访问 文件 数据 的 操作 ， 延 迟 就 会 故 生 。 一 个 文件 的 读 取 不 得 不 等 待 另 一 个 文件 的 读 取 完成 。 当 然 ， 如 果 
DBMS 在 同一 个 文件 中 结合 了 索引 与 数据 ， 这 种 技术 则 不 能 使 用 。 


文件 放置 的 另 一 个 规则 是 分 析 应 用 程序 的 访问 模式 ， 并 将 那些 经 常 一 起 访问 的 表 与 文件 分 离 。DBA 这 么 做 的 原因 与 分 离 索 
引 和 表 文 件 的 原因 相同 。 


最 后 ， 考 虑 当 单 个 表 存 放 在 多 个 文件 时 (分区) ， 文 件 放置 到 独立 的 磁盘 设备 的 情况 。 这 种 情况 下 ， 明 智 的 做 法 是 将 每 个 文 
件 都 放 在 独立 的 磁盘 设备 上 ， 以 鼓励 和 优化 并 行 数据 库 操作 。 如 果 DBMS 可 以 将 查询 分 解 ， 然 后 并 行 运行 ， 将 分 区 表 的 多 个 文件 
放置 在 单独 的 磁盘 设备 上 ， 将 最 大 限度 地 减少 磁盘 延迟 。 


使 用 现代 磁盘 系统 如 RAID 设 备 ， 精 确 的 文件 放置 通常 难以 实现 。RAID 存 储 由 磁盘 驱动 阵列 组 成 ， 分 割 存储 在 磁盘 上 的 文 
IF, 分 别 存 放 在 多 个 物理 磁盘 驱动 上 。 请 务必 阅读 你 的 特定 DBMS 的 文档 ， 并 遵循 关键 系统 文件 (如 日 志和 配置 文件 ) 放置 的 指 
南 。 牢 记 一 个 硬盘 驱动 有 两 个 分 区 : 一 个 放置 日 志文 件 而 另 一 个 放置 数据 文件 ， 这 与 两 个 磁盘 每 个 都 致力 于 日 志 或 数据 是 不 同 


有 关 存 储 和 RAID 的 更 多 信息 ， 请 参阅 第 18 章 。 


数据 库 日 志 放 置 


将 事务 日 志 放 在 与 实际 数据 分 离 的 磁盘 设备 中 ， 使 DBA 能 够 独立 于 数据 库 来 备份 事务 日 志 。 这 也 最 大 限度 地 减少 了 对 同一 
磁盘 的 双 写 入 。 同 时 向 同一 磁盘 上 的 两 个 文件 中 写 入 数据 引起 的 性 能 降低 甚至 超过 了 同时 从 同一 磁盘 上 的 两 个 文件 中 读 取 数 据 引 
起 的 性 能 降低 。 还 要 记 住 ， 每 个 数据 库 修改 (SA) 都 记录 在 数据 库 的 事务 日 志 中 。 


分 布 式 数据 放置 


数据 放置 的 目标 是 通过 减少 物理 设备 上 的 争 用 来 优化 访问 。 在 C/s 的 环境 中 ， 这 个 目标 还 可 以 包括 通过 降低 网 络 传输 的 成 本 
而 实现 应 用 程序 性 能 的 优化 。 


数据 放置 通过 减少 物理 设备 上 的 争 用 来 优化 访问 。 


数据 应 驻 留 在 数据 库 服 务 器 最 有 可 能 或 最 经 常 访问 的 地 方 。 例 如 ，Chicago 数 据 应 驻 留 在 Chicago 的 数据 库 服务 器 上 ，Los 
Angeles 特 定 的 数据 应 驻 留 在 Los Angeles 的 数据 库 服务 器 上 等 。 如 果 划 分 不 那么 明确 (如 San Francisco 的 数据 ， 在 San 
Francisco 没 有 数据 库 服务 器 ) ， 将 数据 放 在 地 理 位 置 上 临近 最 经 常 访问 的 位 置 的 数据 库 服 务 器 上 (对 于 San Francisco, LA, 
不 是 Chicago) 。 


在 分 布 式 网 络 中 放置 数据 时 ， 一 定 要 将 碎片 、 复 制 和 快照 表 考 虑 进去 。 
磁盘 分 配 


DBMS 可 能 需要 分 配 磁 盘 设 备 供 数据 库 使 用 。 如 果 这 样 ，DBMS 会 提供 初始 化 物理 磁盘 设备 的 命令 。 该 命令 与 物理 磁盘 分 区 
或 OS 文 件 的 逻辑 名 称 相关 。 磁 盘 初 始 化 完成 后 ， 将 存储 在 系统 目录 中 ， 供 存储 表 数 据 使 用 。 


在 初始 化 磁盘 之 前 ， 一 定 要 确认 该 物理 磁盘 设备 是 否 有 足够 的 可 用 空间 。 同 样 ， 请 确保 该 设备 尚未 初始 化 。 


使 用 有 意义 的 设备 名 称 ， 以 促进 磁盘 设备 的 使 用 和 管理 更 高 效 。 例 如 ， 一 个 名 为 DUMP_DEV1 或 TEST_DEV7 的 设备 的 用 途 


会 被 误解 ， 而 名 称 XYZ 或 A193 就 不 是 特别 有 用 了 。 此 外 ， 通 过 保存 那些 包含 实际 初始 化 命令 和 可 以 显示 设备 分 配 空间 的 图 表 
的 脚本 文件 ， 保 留 已 初始 化 设备 的 文档 。 


使 用 有 意义 的 设备 名 称 以 促进 使 用 更 高 效 。 


11.1.10 READ (RK) 


大 多 数 DBM S 能 够 指定 页 面 或 块 的 大 小 。 页 面 大 小 用 于 在 磁盘 上 存储 表 的 行 (或 者 ， 更 准确 地 说 ， 是 包含 行 的 内 容 加 上 各 种 
开销 的 记录 ) 。 例 如 ， 一 张 表 ， 行 的 长 度 是 125B， 另 有 6B 的 额外 开销 。 这 使 得 每 条 记录 的 长 度 为 131B。 在 页 面 存储 25 条 记录 ， 
页 面 的 大 小 至 少 是 3275B。 然 而 ， 每 个 DBM S 都 需要 一 定数 量 的 页 面 开 销 ， 因 此 实际 大 小 会 很 大 。 如 果 页 面 开 销 达 到 20B， 页 面 
的 大 小 将 是 3297B， 即 3275+20B 的 开销 。 


选择 合适 的 页 面 大 小 是 DBA 的 一 项 重要 任务 。 


但 是 ， 这 种 讨论 过 于 简单 。 在 一 般 情况 下 ， 大 多 数 的 表 空 间 需 要 一 定数 量 的 可 用 空间 来 容纳 新 的 数据 。 因 此 ， 以 上 公式 还 要 
考虑 一 定 比例 的 可 用 空间 。 


为 了 使 事情 复杂 化 ， 许 多 DBMS 都 限制 了 可 选 的 页 面 大 小 。 例 如 ，z/Os 的 DB2 将 页 面 大 小 限制 为 4K、8K、16K 或 32K; 
Microsoft SQL server 公 支持 8K 的 页 面 大 小 。 按 照 DB2 的 情况 ，DBA 需 要 根据 行 的 大 小 、 每 页 的 行 数 和 所 需 的 可 用 空间 计算 出 
最 佳 的 页 面 大 小 。 


考虑 这 样 一 个 问题 : 在 z/OS 的 DB2 中 ， 如 果 不 需要 可 用 空间 ， 并 且 记 录 的 大 学 为 2500B， 那 么 页 面 的 大 小 应 选择 哪个 ? 


最 简单 的 答案 是 4K， 但 这 可 能 不 是 最 好 的 答案 。 一 个 4K 的 页 面 将 保存 2500B 的 记录 ， 而 8K 的 页 面 将 保存 3 个 2500B 的 记录 。 
8K 的 页 面 可 以 提供 更 高 效 的 顺序 /OO 处理， 因为 读 取 8K 的 数据 会 返回 3 行 ， 而 使 用 两 个 4K 的 页 面 来 读 取 8K 的 数据 只 返回 2 行 。 


选择 合适 的 页 面 大 小 是 DBA 优 化 数据 库 MO 性 能 的 一 项 重要 任务 。 


11.2 “数据库 重 组 


关系 技术 和 SQL 使 数据 修改 更 容易 。 只 要 发 出 INSERT、UPDATE 或 DELETE 语 句 ， 然 后 由 适当 的 WHERE 子 句 和 DBMS 负 责 
实际 的 数据 导航 和 修改 即 可 。 为 了 提供 这 个 级 别 抽 象 ，DBMS 负 责 处 理 磁 盘 上 数据 的 物理 位 置 和 移动 。 理 论 上 ， 这 是 每 个 人 都 乐 
见 的 。 简 化 的 编程 接口 ， 并 且 RDBMS 负 责 最 困难 的 部 分 (操作 数据 的 实际 位 置 ) 。 然 而 ， 事 情 并 不 那么 简单 。DBMS 物 理 管理 
数据 的 方式 可 能 会 导致 后 续 的 性 能 问题 。 

每 个 DBA 都 会 遇 到 这 种 情况 : 某 个 查询 或 应 用 程序 一 直 运 行 良好 ， 但 在 生产 环境 运行 一 段 时 间 之 后 会 变 慢 。 这 种 减速 有 许 
多 潜在 因素 ， 可 能 是 发 出 事务 的 数量 增加 了 ， 也 可 能 是 数据 量 扩大 了 。 但 是 ， 性 能 问题 可 能 是 由 于 数据 库 混 乱 。 当 数据 库 的 逻辑 
和 物理 存储 分 配 包含 许多 分 散 的 存储 区 域 ， 这 些 区 域 很 小 且 又 不 连续 或 难以 使 用 时 ， 数 据 库 就 会 发 生 混乱 。 下 面 回 顾 主要 的 元 


区 | : 


查询 或 应 用 程序 减速 有 许多 潜在 的 因素 。 


- 第 一 种 可 能 是 非 集群 数据 。 如 果 DBMS 不 严格 执行 集群 ， 随 着 数据 的 添加 和 变更 ， 集 群 表 或 索引 也 可 以 变 成 非 集 群 。 如 果 
数据 明显 变 得 非 集群 ， DBMS 便 不 能 依赖 该 集群 序列 。 因 为 数据 不 再 集群 ， 那 些 为 访问 数据 而 优化 了 的 查询 便 不 能 充分 利用 该 集 
群 序列 。 在 这 种 情况 下 ， 针 对 非 集群 表 的 查询 性 能 将 受到 影响 。 


* 碎片 的 条 件 是 : 数据 库 中 有 太 多 分 散 的 存储 区 域 ， 小 且 不 能 有 效 利 用 。 这 会 导致 空间 的 浪费 ， 进 而 造成 性 能 的 降低 ， 因 为 
需要 额外 的 I/O 检 索 相 同 的 数据 。 


当 更 新 后 的 数据 不 适合 其 当前 占用 的 区 域 ， 并 且 DBMS 需 要 为 它 寻 找 空间 时 ， 行 链接 或 行 迁 移 就 会 发 生 。 通 过 行 链 
接 ，DBMS 可 以 将 一 部 分 新 的 、 较 大 的 行 转移 到 表 空 间 的 可 用 空间 。 通 过 行 迁 移 ， 整 行 可 以 都 放 在 表 空 间 的 其 他 地 方 。 每 种 情况 
都 会 使 用 指针 来 定位 行 的 其 他 部 分 或 整 行 。 行 链接 和 行 迁移 都 会 导致 多 个 I/O 来 读 取 单 行 。 


. 分 页 可 能 也 会 导致 数据 库 混乱 。 如 果 DBMS 在 应 该 执行 正常 分 页 时 执行 了 单调 的 分 页 ， 或 者 相反 ， 空 间 可 能 会 浪费 。 一 旦 
4 行 就 越 少 ， 进 而 导致 DBMS 发 出 更 多 的 I/O 请 求 来 检索 数据 。 因 此 ， 性 能 会 再 一 次 受到 影响 。 


* 文件 扩展 可 以 对 性 能 产生 负面 影响 。 扩 展 是 捆绑 在 原始 文件 上 的 附加 文件 ， 仅 可 与 原始 文件 一 起 使 用 。 当 表 空 间 所 使 用 的 
空间 用 完 时 ， 就 会 为 该 文件 添加 一 个 扩展 区 用 于 扩展 。 然 而 ， 文 件 扩展 并 没有 与 原始 文件 连续 存储 。 添 加 额外 的 扩展 区 时 ， 数 据 
请 求 将 需要 逐个 扩展 区 跟踪 数据 ， 额 外 的 代码 也 不 再 是 不 必要 的 开销 了 。 重 置 数据 库 空间 需求 和 重组 可 用 来 清理 文件 扩展 区 。 


通过 比较 图 11-4 和 图 11-5 来 看 一 个 混乱 的 表 空间 。 假 设 该 表 空间 由 跨 多 个 块 的 三 个 表 组 成 ， 如 图 11-4 所 描述 的 表 空 间 和 
每 


表 。 每 个 方块 代表 一 个 数据 页 。 


现在 对 这 些 表 中 的 数据 进行 一 些 变 更 。 首 先 ， 添 加 6 行 到 第 二 个 表 。 但 是 ， 没 有 可 用 空间 存储 这 些 新 行 了 。 那 么 ， 要 如 何 添 
加 这 些 行 呢 ?DBMS 需 要 一 个 额外 的 扩展 区 来 放置 新 行 。 这 会 导致 碎片 : 新 行 放置 在 非 连续 的 空间 。 第 二 个 变更 是 更 新 第 一 个 表 
中 的 一 行 来 改变 可 变 长 度 的 列 。 例 如 ， 将 LASTNAME 列 的 值 从 AWTSON 改 为 BEAUCHAMP。 这 个 更 新 的 发 出 会 导致 行 大 小 的 
扩展 ， 因 为 新 行 LASTNAME 的 值 更 长 : BEAUCHAMP 包 含 9 个 字符 ， 而 WATSON 只 包含 6 个 字符 。 这 种 行为 会 导致 行 链 接 。 由 
此 产生 的 表 空 间 描绘 了 碎片 和 行 链接 ， 如 图 11-5 所 示 。 


BE 
mx 
DES 
| | 空白 


Ra Hj 


图 11-5 ”混乱 的 表 空 间 


根据 DBMS， 可 能 有 其 他 原因 引起 混乱 。 例 如 ， 如 果 一 个 表 空 间 里 定义 了 多 个 表 ， 删 除了 一 个 表 之 后 ， 表 空间 可 能 需要 进行 
重组 来 回收 空间 。 


为 了 纠正 混乱 的 数据 库 结构 ，DBA 可 以 运行 数据 库 或 表 空 间 重 组 的 实用 程序 (REORG) ， 人 迫使 DBM 对 数据 库 对 象 进行 
重新 调整 ， 从 而 消除 一 些 问 题 ， 如 非 集群 数据 、 碎 片 和 行 链接 。 重 组 的 主要 优点 在 于 数据 库 速 度 和 效率 的 提升 ， 因 为 数据 在 磁盘 
上 以 一 种 更 优化 的 方式 进行 组 织 。 简 单 地 说 ， 重 组 将 数据 库 的 可 用 性 和 可 靠 性 最 大 化 。 


重组 导致 DBMS 对 数据 库 对 象 进行 重新 调整 ， 从 而 将 数据 库 的 可 用 性 、 速 度 和 效率 最 大 化 。 


表 空 间 和 索引 都 可 以 进行 重组 。DBA 如 何 运行 一 个 REORG 实 用 程序 取决 于 DBMS。 有 些 DBMS 产 品 附带 一 个 内 置 的 重组 实 
用 程序 ， 有 些 则 需要 客户 购买 ， 还 有 一 些 产 品 声 称 客户 使 用 他 们 的 DBM SS 根本 不 需要 任何 实用 程序 。 我 发 现 最 后 一 种 说 法 不 真 
实 。 当 添加 和 修改 数据 时 ， 每 个 DBMS 都 会 引发 一 定 程度 的 混乱 。 


当然 ，DBA 可 以 通过 完全 重建 数据 库 来 进行 手动 重组 。 但 是 ， 实 现 这 样 的 重组 需要 一 系列 复杂 的 步骤 。 图 11-6 描 述 了 手动 
重组 所 需 的 步 又。 


删除 表 
THRA 


重建 表 
“IAI AT AR 


GAR 
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图 11-6 手动 重组 的 标准 步骤 
如 果 DBMS 供 应 商 或 第 三 方 供应 商 提供 用 于 重组 的 实用 程序 ， 以 上 过 程 就 大 大 简化 了 。 有 时 ， 实 用 程序 就 像 发 出 一 个 命令 一 
样 简单 。 如 : 


REORG TABLESPACE TSNAME 


传统 的 重组 需要 数据 库 停 止 服务 。 停 机 的 高 成 本 对 执行 和 延迟 定期 维护 都 造成 了 压力 ， 这 种 两 难 的 情况 为 大 多 数 DBA 所 熟 
悉 。 某 些 REORG 实 用 程序 可 以 在 数据 库 运 行 的 同时 执行 重组 。 这 样 的 重组 是 通过 创建 一 个 数据 副本 实现 的 。 原 始 数据 保持 在 线 
的 同时 ， 在 线 的 REORG 实 用 程序 对 数据 副本 进行 重组 。 副 本 完成 了 重组 ， 在 线 的 REORG 便 使 用 数据 库 日 志 “ 赶 上 ”此 过 程 中 的 
任何 数据 变更 。 当 副本 赶 上 了 原始 数据 时 ， 在 线 的 REORG 便 将 生产 环境 的 表 空 间 切换 成 副本 数据 。 执 行 在 线 的 重组 需要 额外 的 
磁盘 存储 和 一 个 缓慢 的 事务 窗口 。 如 果 在 线 重组 期 间 有 大 量 的 事务 发 生 ，REORG 可 能 很 难 有 时 间 赶 上 。 


11.2.1 决定 何 时 进行 重组 


系统 目录 统计 信息 可 以 帮助 确定 何 时 对 数据 库 对 象 进行 重组 。 每 个 DBMS 都 提供 了 一 种 通读 数据 库 内 容 和 记录 每 个 数据 库 对 
象 统计 信息 的 方法 。 根 据 不 同 的 DBMS， 这 一 统计 信息 要 么 存储 在 系统 目录 中 ， 要 么 存储 在 数据 库 对 象 本 身 的 特殊 页 面 中 。 


集群 比 是 一 种 可 以 帮助 DBA 确 定 适当 进行 重组 的 统计 信息 。 它 是 实际 存储 在 集群 序列 中 表 的 行 的 百分比 。 该 集群 比 越 接近 
100%， 数 据 页 面 行 的 实际 顺序 就 越 匹 配 集群 序列 。 较 低 的 集群 比 表 示 坏 集群 ， 并 且 可 能 需要 进行 重组 。 但 是 ， 如 果 大 部 分 的 查 
询 是 随机 访问 数据 而 不 是 顺序 访问 ， 那 么 低 集群 比 可 能 就 不 会 成 为 性 能 的 障碍 。 


集群 比 是 实际 存储 在 集群 序列 中 表 的 行 的 百分比 。 


有 时 很 难 追查 导致 混乱 的 其 他 原因 。 有 的 DBMS 可 以 收集 碎片 、 行 链接 、 被 删除 对 象 的 空间 以 及 分 页 的 统计 信息 ， 有 的 则 不 
会 。Oracle 提 供 了 大 量 的 统计 信息 ， 存 储 在 可 以 查询 的 动态 性 能 表 中 。 请 参阅 “Oracle 动 态 性 能 表 ” 了 解 更 多 详情 。 | 


表 空 间 不 是 唯一 可 以 进行 重组 的 数据 库 对 象 。 索 引 也 可 以 从 重组 中 收益 。 在 表 中 添加 和 修改 数据 时 ， 索 引 也 必须 进行 变更 。 
这 样 的 变更 可 能 会 导致 索引 杂乱 无 章 。 


Oracle 动 态 性 能 表 


Oracle 将 有 关 数 据 库 系统 的 重要 性 能 统计 信息 存储 在 一 系列 动态 性 能 表 中 。 这 些 表 有 时 也 称 作 “V$ 表 ”， 因 为 表 的 名 称 将 字 


符 V$ 作 为 前 缓 。 


V$ 表 由 内 置 的 Oracle 性 能 监测 实用 程序 使 用 ， 并 且 可 以 由 DBA 进 行 查询 ， 以 便 洞察 Oracle 实 例 的 性 能 。 可 以 在 V$ 表 中 找到 的 
统计 信息 的 例子 有 : 


可 用 空间 ，; 
- 链接 的 行 ; 


- 回 滚 段 的 争 用 和 活动 ; 


“内存 的 使 用 ; 
门 锁 活动 ， 
E 缓冲 等 待 ; 
BEE EHH 


当然 ， 在 这 些 表 中 可 以 找到 相当 多 的 额外 性 能 信息 。Otacle DBA 应 定期 对 V$ 表 进行 研究 和 查询 ， 以 分 析 Otacle 系 统 的 性 能 、 


数据 库 和 应 用 程序 。 


级 别 是 一 种 需要 监测 的 重要 索引 统计 信息 。 第 4 章 中 ， 大 多 数 的 关系 索引 都 是 b-tree 结 构 。 索 引 中 添加 数据 时 ，b-tree 的 级 
别 将 增长 。b-tree 中 存在 的 级 别 越 高 ， 从 索引 结构 项 部 移动 到 必须 访问 的 实际 数据 所 需 的 I/O 请 求 就 越 多 。 重 组 索引 可 能 会 导 
该 索引 的 结构 更 好 并 需要 较 少 的 级 别 。 

另 一 种 需要 分 析 以 确定 是 否 需 要 进行 重组 的 索引 统计 信息 是 索引 页 级 页 之 间 的 距离 或 叶 的 距离 。 叶 的 距离 是 索引 中 连续 的 叶 
级 页 的 平均 数量 的 估计 。 叶 级 页 之 间 的 缺口 可 能 由 数据 从 索引 删除 (或 者 分 页 ) 而 进一步 发 展 。 当 然 ， 零 是 叶 距 离 的 最 佳 值 ， 但 
在 实践 中 达到 零 是 不 现实 的 。 一 般 情况 下 ， 这 个 值 越 低 越 好 。 一 定 要 不 断 检 查 这 个 值 ， 确 定 出 可 以 表明 应 对 索引 进行 重组 的 叶 的 
距离 的 最 大 值 。 


[1] Microsoft SQL Servet 中 的 动态 性 能 视图 与 Oracle 动 态 性 能 表 类 似 。DB2 for z/OS 提供 实时 统计 信息 。 


11.2.2 自动 化 


如 果 可 能 ，DBA 应 该 考虑 使 用 数据 库 实用 程序 或 第 三 方 工具 来 自动 进行 重组 。 自 动 化 工具 可 以 用 来 查询 数据 库 统计 信息 ， 
并 且 只 有 在 这 些 数据 库 对 象 超过 组 合 统计 的 最 大 值 时 触发 重组 。 例 如 ， 集 群 比 低 于 85% 以 及 所 有 索引 的 叶 的 距离 的 值 大 于 100 
时 ，DBA 可 能 要 自动 重组 所 有 的 表 空 间 。 


考虑 使 用 数据 库 实用 程序 或 第 三 方 工 具 来 自动 进行 重组 。 


从 停机 和 计算 资源 的 角度 来 看 ， 重 组 可 能 非常 昂贵 。 此 外 ， 确 定 何 时 重组 可 以 真正 地 创建 性 能 提升 可 能 很 困难 。 但 是 ， 当 数 
据 非 集群 、 支 离 破碎 或 杂乱 无 章 时 ， 重 组 带 来 的 性 能 的 累积 提升 将 是 巨大 的 。 聪 明 的 DBA 会 计划 并 安排 重组 来 解决 其 数据 库 系 
统 的 混乱 问题 。 


11.3. 7 


应 用 程序 和 数据 都 在 不 断 变 化 。 用 户 需要 即时 响应 时 间 和 24/7 的 可 用 性 。 支 持 这 些 应 用 程序 的 数据 库 结构 必须 进行 适当 的 
维护 ， 以 确保 最 佳 的 应 用 性 能 。 正 确 的 数据 库 设 计 、 选 用 合适 的 集群 以 及 基于 统计 的 重组 数据 库 ， 有 助 于 实现 高 效 的 数据 库 。 此 
外 ，DBA 可 以 通过 将 这 些 流程 自动 化 ， 减 少 风险 和 手动 数据 库 维 护 引 起 的 错误 ， 从 而 确保 数据 库 的 性 能 。 


11.4 [alpen 


1.DBA 可 以 用 来 提升 数据 库 性 能 的 最 佳 性 能 调整 技术 是 什么 ? 
2. 非 规范 化 物理 数据 模型 的 唯一 原因 是 什么 ? 

3. 集 群 数据 的 好 处 是 什么 ? 

4 单个 表 应 定义 多 少 个 索引 ? 

5. 讨 论 为 数据 库 对 象 提供 可 用 空间 的 利 浆 。 

6. 是 什么 导致 了 数据 库 和 索引 的 混乱 ? 

7. 文 件 扩展 区 如 何 使 数据 库 的 性 能 降低 ? 

8. 分 区 表 可 以 得 到 什么 样 的 性 能 优势 ? 

9. 请 解释 术语 “ 叶 的 距离 ”， 以 及 它 对 索引 性 能 很 重要 的 原因 。 


10. 在 单独 的 磁盘 设备 上 分 配 表 空间 和 索引 的 好 处 是 什么 ? 
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第 12 章 ”应 用 程序 性 能 


前 面 已 经 分 别 从 系统 和 数据 库 的 角度 对 性 能 进行 了 讨论 ， 现 在 是 时 候 把 注意 力 转移 到 应 用 程序 代码 角度 来 看 性 能 了 。 本 章 的 
重点 在 于 调整 与 优化 应 用 程序 代码 和 SQL 语 句 ， 以 及 确保 应 用 程序 与 DBMS 能 够 适当 且 高 效 地 进行 交互 。 粗 制 小 造 的 应 用 代码 几 
乎 占据 了 导致 关系 数据 库 性 能 问题 的 绝 大 部 分 ， 多 达 80% 的 性 能 问题 可 以 追溯 到 应 用 程序 。 


粗制滥造 的 应 用 代码 几乎 占据 了 导致 关系 数据 库 性 能 问题 的 绝 大 部 分 。 


12.1 设计 关系 访问 的 应 用 程序 


应 用 程序 设计 的 问题 已 经 在 第 5 章 进 行 了 讨论 ， 但 当 应 用 程序 的 性 能 受到 影响 时 ， 这 个 问题 就 该 重新 考虑 。 也 许 应 用 程序 设 
计 不 当 ， 全 部 或 其 中 一 部 分 需要 进行 重 写 。 应 用 程序 的 设计 在 一 开始 就 应 符合 性 能 的 要 求 ， 因 为 后 期 变更 应 用 程序 的 设计 几乎 是 
不 可 能 的 、 不 切实 际 的 或 大 过 昂贵 。 


应 用 程序 的 性 能 受到 影响 时 ， 需 要 检查 的 设计 问题 包括 : 


-SQL 的 类 型 
确 ? 


BARES 


编程 语言 是 否 达到 所 需 的 性 能 ? 语 


对 于 这 个 特定 的 应 用 程序 ，SQL 的 类 型 (计划 的 或 未 计划 的 、 动 态 的 或 静态 的 、 揪 入 式 的 或 独立 的 ) AGE 


' 事务 的 设计 和 处 理 。 程 序 中 的 习 
务 处 理 器 ? 


环境 是 否 为 数据 库 访问 进行 了 优化 ? 


是 否 进 行 了 合理 的 设计 以 保证 ACID 的 属性 ? 该 程序 是 否 使 用 和 选择 了 适当 且 高 效 的 习 


: 锁 策 略 。 该 应 用 程序 是 否 持 有 错误 的 锁 ? 或 持 有 正确 的 锁 的 时 间 太 长 ? 


> COMMIT 策 略 。 每 个 应 用 程序 是 否 都 发 出 了 SQL COMMIT 语 句 ， 将 锁 的 影响 降 到 最 低 ? 
“ 批 处 理 。 批 处 理 的 设计 是 否 合理 ? 是 否 可 以 充分 利用 DBMS 的 顺序 处 理 功 能 ? 


:在线 处 理 。 在 线 应 用 程序 的 设计 是 否 能 够 返回 有 用 的 信息 ? 是 否 能 够 尽量 减少 程序 单 次 调用 向 用 户 返回 信息 的 数量 ? 


12.2 关系 优化 


DBA 必 须 对 企业 使 用 的 每 个 DBMS 的 优化 技术 都 非常 熟悉 。 当 然 ， 应 用 程序 开发 人 员 必 须 编写 有 效 的 SQL 并 且 知 道 如 何 优化 
它们 ， 但 最 终 数据 库 应 用 程序 的 性 能 是 


RGAE 


由 DBA 负 责 的 。 因 此 ，DBA 必 须 熟 练 掌握 SQL 编程 和 SQL 的 性 能 调 优 。 


优化 程序 是 天 系数 据 库 管理 系统 的 心脏 。 它 是 一 种 专门 负责 为 任何 给 定 的 SQL 请 求 确定 最 佳 数 据 库 导航 策略 的 接口 引擎。 
优化 程序 是 一 种 确定 数据 库 导 航 策略 的 接口 引擎 。 
应 用 程序 开发 人 员 指定 SQL 语句 需要 的 数据 ，DBMS 提 供 数据 位 置 的 信息 ， 关 系 优化 程序 则 决定 如 何 高 效 地 导航 数据 库 。 终 
端 用 户 不 需要 知道 实际 数据 存储 在 哪里 以 及 如 何 存储 ， 而 优化 程序 知道 。 


式 。 这 一 过 程 就 叫做 关系 优化 ， 如 图 12-1 所 示 。 


为 了 优化 SQL， 关 系 优化 程序 必须 对 每 个 SQL 语 句 的 语法 进行 分 析 ， 以 确定 必须 要 访问 的 表 和 列 。 优 化 程序 也 将 访问 由 
RDBMS 存 储 在 系统 目录 或 数据 库 对 象 中 的 统计 信息 。 统 计 信息 用 来 确定 实现 那些 为 了 满足 SQL 请 求 而 需要 执行 的 任务 的 最 佳 方 


关系 优化 非常 强大 ， 它 可 以 让 查询 适应 不 断 变化 的 数据 库 环境 。 优 化 程序 可 以 通过 制定 新 的 访问 路 径 对 变更 作出 反应 ， 而 无 
须 真 的 实施 应 用 程序 代码 变更 。 因 此 应 用 程序 是 灵活 的 ， 正 如 表 的 大 小 可 以 扩大 或 缩小 一 样 ， 索 引 可 以 添加 或 删除 ， 数 据 库 可 以 
变 得 杂乱 无 章 或 进行 重组 。 


无 论 数据 如 何 被 物理 地 存储 或 操纵 ，SQL 都 可 用 于 数据 的 访问 ， 并 且 DBM 在 优化 数据 访问 的 同时 ， 也 会 将 数据 库 的 当前 状 
态 考 虑 在 内 。 这 种 访问 标准 与 物理 存储 分 离 的 特性 叫做 物理 数据 的 独立 性 。 
每 个 RDBMS 都 有 一 个 内 内 的 关系 优化 程序 ， 可 以 用 来 将 SQL 语句 翻译 成 可 执行 的 访问 路 径 


径 。 此 外 ， 各 个 供应 商 的 关系 优化 
程序 的 工作 原理 也 有 所 不 同 ， 步 又 不 同 且 使 用 的 信息 也 不 同 。 然 而 ， 每 个 DBMS 优 化 程序 的 核心 是 相同 的 。 优 化 程序 解析 SQL 语 


句 并 执行 各 阶段 的 优化 ， 通 常会 涉及 语法 和 语义 的 正确 性 验证 、 查 询 分 析 和 访问 路 径 的 制定 ， 以 满足 查询 。 


> 
pe 一 
优化 提示 确定 
| 最 佳 存 取 >K 
———_ < ra Bec ses 
SQL 请 求 Seyd st 


系统 信息 


退出 或 保存 Ay PS 
/ 访问 路 径 


rr ~~ 


执行 优化 后 | .--” ARER 


> 查询 结果 |H 


—_— 


BAT 


的 SQL 


图 12-1 关系 优化 


关系 优化 程序 可 以 部 署 多 种 类 型 的 策略 ， 用 于 DBMS 优 化 SQL 语句 。 每 个 DBMS 所 使 用 的 内 部 操作 和 指令 都 受到 严密 保护 。 
现代 关系 优化 程序 都 是 基于 成 本 的 ， 这 意味 着 优化 程序 会 尝试 为 每 个 查询 都 制定 一 个 访问 路 径 来 降低 总 成 本 。 如 果 以 这 种 方式 运 
作 ， 优 化 程序 必须 对 多 种 因素 进行 评估 和 分 析 ， 包 括 佑 计 的 CPU 和 IO 成 本 、 数 据 库 统计 信息 和 实际 的 SQL 语句 。 


12.2.1 CPU 和 MO 成 本 


关系 优化 程序 使 用 公式 和 模型 对 运行 每 个 潜在 访问 路 径 (用 于 不 断 优化 的 查询 ) 的 机 器 成 本 进行 估计 。 基 于 CPU 的 信息 ， 
优化 程序 可 以 粗略 得 出 使 用 由 它 分 析 的 每 个 最 佳 访问 路 径 的 查询 运行 所 需 的 CPU 时 间 。 


此 外 ， 天 系 优化 程序 必须 估计 数据 实际 写 入 和 检索 的 成 本 。 优 化 程序 在 数据 库 统 计 信息 、 数 据 高 速 缓存 的 效率 以 及 中 间 工 作 
文件 MO 的 成 本 的 基础 上 ， 通 过 使 用 一 系列 公式 来 估计 查询 I/O 的 成 本 。 这 些 公式 会 产生 一 个 过 滤 系 数 ， 它 决定 了 该 查询 的 相关 
IO 成 本 。 


12.2.2 ”数据 库 统计 信息 


没有 存储 在 数据 库 中 数据 的 准确 统计 信息 ， 关 系 优化 程序 就 没有 多 大 用 处 。 关 系 型 DBMS 提 供 了 一 个 实用 程序 或 命令 来 收集 
数据 库 对 象 的 统计 信息 ， 并 且 将 它们 存储 下 来 供 优化 程序 使 用 (或 者 供 性 能 监测 的 DBA 使 用 ) 。 例 如 ， 收 集 DB2 的 统计 信 
息 ，DBA 必 须 执行 实用 程序 RUNSTATS; 收集 SQL Server 的 统计 信息 ， 则 要 发 出 UPDATE STATISTICS 命 令 。 


没有 准确 的 统计 信息 ， 关 系 优化 程序 就 没有 多 大 用 处 。 


每 当 有 重大 的 数据 添加 或 修改 时 ，DBA 还 应 收集 修改 后 的 统计 信息 。 如 果 不 这 么 做 ,会 导致 优化 程序 的 成 本 估算 基于 不 准 
确 的 统计 信息 。 这 可 能 对 查询 的 性 能 不 利 。 


数据 库 统计 信息 为 优化 程序 提供 了 表 空 间 、 表 、 列 和 索引 状态 的 信息 。DBMS 收 集 的 统计 信息 有 : 
“REM. RAK IMATE 
ABA PRL KE 
IP RE B OLA Lh 
Kaw RR (RIL RR) 。 
+ 集群 表 的 集群 比 的 详细 说 明 。 
列 与 其 他 列 的 相关 性 。 
- 索引 或 表 空间 的 结构 状态 。 


* 数据 库 对 象 使 用 的 存储 量 。 


密度 
密度 是 存储 在 索引 关键 列 中 的 重复 值 平均 所 占 的 百分比 ， 是 以 百分比 的 形式 记录 的 。 例 如 ， 密 度 为 50% 意 味 着 : 对 于 一 个 给 


定 的 索引 关键 值 ， 期 望 返回 50% 的 行 。 下 面 的 公式 确定 了 通过 索引 访问 表 时 ， 期 望 返回 的 行 的 平均 数目 : 
平均 行 数 = 总 行 数 X 密度 
例如 ， 通 过 索引 访问 一 个 1000 行 、 密 度 是 50% 的 表 : 
平均 行 数 =1000 X0.50=500 
通过 索引 访问 一 个 20000 行 、 密 度 是 15% 的 表 : 
平均 行 数 =20000X0.15=3000 
该 信息 对 优化 程序 有 用 ， 因 为 它 有 助 于 确定 结果 集 的 大 小 ， 从 而 确定 某 个 索引 是 否 对 特定 的 访问 路 径 有 帮助 。 


在 发 出 命令 RUNSTATS 或 UPDATE STATISTICS 的 同时 ，DBA 指 定 了 要 收集 哪些 统计 信息 。 当 然 ， 每 个 DBMS 要 收集 的 确切 
的 统计 信息 也 不 尽 相 同 。 而 且 ， 你 的 数据 库 系 统 中 可 用 的 统计 信息 也 有 多 有 少 。 但 是 ， 重 要 的 是 要 保持 统计 信息 尽 可 能 准确 ， 以 
确保 关系 优化 的 高 效 、 实 用 。 


针对 测试 数据 库 开发 应 用 程序 时 ， 测 试 数据 的 统计 数据 不 能 准确 反映 生产 数据 库 的 统计 信息 。 只 要 有 可 能 ，DBA 应 该 与 应 


用 程序 开发 团队 合作 创建 一 个 脚本 ， 把 生产 环境 的 统计 信息 填充 到 测试 系统 中 。 根 据 不 同 的 DBMS， 这 可 以 通过 SQL 语句 或 数据 
测试 工具 实现 。 没 有 生产 环境 的 统计 信息 ，DBMS 测 试 环境 选择 的 访问 路 径 可 能 与 生产 环境 的 不 同 ， 这 可 能 会 导致 应 用 程序 进入 
生产 状态 后 出 现 性 能 问题 。 


创建 一 个 脚本 ， 把 生产 环境 的 统计 信息 填充 到 测试 系统 中 。 


12.2.3 查询 分 析 


查询 分 析 对 SQL 语句 进行 扫描 以 确定 其 整体 的 复杂 性 。SQL 语 句 的 制定 是 确定 优化 程序 选择 访问 路 径 的 一 个 重要 因素 。 碍 询 
的 复杂 性 、 谓 词 的 类 型 和 数量 、 函 数 的 参与 以 及 排序 子 句 的 参与 都 将 计 入 优化 程序 计算 的 估算 成 本 中 。SQL 语 句 越 复杂 ， 为 了 使 
这 些 SQL 语 句 有 意义 而 必须 要 做 的 查询 分 析 工 作 就 越 多 。 


SQL 语句 越 复杂 ， 必 须要 做 的 查询 分 析 工 作 越 多 。 

在 查询 分 析 过 程 中 ， 优 化 程序 需要 对 SQL 语句 和 数据 库 系统 的 如 下 方面 进行 分 析 : 
需要 哪个 数据 库 中 的 哪些 表 ? 

` 是 否 有 视图 需要 分 解 成 基础 表 ? 

“ 是 否 需要 表 连 接 或 子 查询 ? 

- 是 否 需要 UNION、EXCEPT 或 INSERSECT? 

. 如 果 有 索引 ， 可 以 使 用 哪些 ? 

` 必须 要 满足 的 谓词 (WHERE 子 句 ) 有 多 少 ? 

. 哪些 功能 必须 执行 ? 

- 该 SQL 是 否 使 用 了 OR 或 AND? 

- DBMS 是 如 何 处 理 SQL 语 名 的 各 个 部 分 的 ? 

: 为 SQL 语句 中 表 使 用 的 数据 高 速 缓存 分 配 了 多 少 内 存 ? 

` 如 果 该 查询 需要 排序 ， 有 多 少 内 存 可 供 排序 使 用 ? 

换 名 话说， 查询 分 析 将 SQL 语句 分 解 成 一 些 必 须 执 行 的 离散 任务 来 返回 查询 结果 。 


查询 分 析 中 很 大 的 一 部 分 是 索引 的 选择 。 在 优化 程序 确定 了 可 供 每 个 谓词 使 用 的 索引 之 后 ， 它 会 决定 是 否 要 使 用 单个 索引 、 
多 个 索引 ， 或 干脆 不 需要 索引 。 


12.2.4 连接 


当 访 问 多 个 表 时 ， 优 化 程序 会 计算 出 如 何以 最 有 效 的 方式 合并 这 些 表 。 多 个 表 的 信息 合并 在 一 起 称 作 连接 。 在 确定 连接 的 访 


问 路 径 时 ， 优 化 程序 必须 确定 这 些 表 将 以 什么 顺序 连接 ， 计 算出 估算 每 个 访问 路 径 的 总 成 本 ， 并 为 这 个 特定 的 查询 选择 一 种 连接 
方式 。DBMS 可 以 使 用 几 种 不 同 的 方式 连接 表 。 

多 个 表 的 信息 合并 在 一 起 称 作 连 接 。 

无 论 使 用 哪 种 连接 方式 ，DBMS 都 必须 做 出 几 项 决定 并 执行 某 些 操作 。 第 一 个 决定 是 选择 首先 要 处 理 的 表 ， 这 个 表 称 作 外 部 
表 ; 接 下 来 ， 在 外 部 表 执行 一 系列 的 操作 为 连接 做 好 准备 ; 然后 ， 该 表 的 行 与 第 二 个 表 (叫做 内 部 表 ) 的 行 合并 ， 如 图 12-2 所 
示 。 在 连接 开始 前 (或 连接 进行 时 ， 或 两 种 情况 下 ) 也 需要 在 内 部 表 执 行 一 系列 操作 。 
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图 12-2 ”连接 表 


虽然 所 有 连接 的 功能 类 似 ， 但 每 种 连接 方式 的 幕后 工作 方式 不 尽 相 同 。 下 面 研究 两 种 常见 的 连接 方式 : kk BH EA OF 
扫描 连接 。 当 然 ， 还 有 其 他 的 连接 方式 如 DB2 的 混合 动力 连接 和 SQL Server 的 散 列 连接 ， 但 在 这 里 只 讨论 这 两 种 最 常见 的 方 
式 。 

许 套 循环 连接 是 把 外 部 表 中 符合 条 件 的 行 与 内 部 表 进行 比较 。 确 定 了 外 部 表 中 符合 条 件 的 行 ， 再 对 内 部 表 进 行 扫 描 ， 看 是 否 
有 与 该 行 匹配 的 。 符合 条 件 的 行 即 表 的 列 的 谓词 与 条 件 相 匹配 的 行 。 内 部 表 扫 描 完成 后 ， 确 定 外 部 表 的 另 一 个 符合 条 件 的 行 ， 再 
次 扫描 内 部 表 ， 以 此 类 推 。 为 了 避免 不 必要 的 I/O 成 本 ， 内 部 表 的 重复 扫描 通常 是 用 索引 实现 的 。 内 部 表 越 小 ， 执 行 谋 套 循环 连 
接 就 越 容易 ， 因 为 需要 扫描 的 行 越 少 。 

第 二 种 连接 方式 是 合并 扫描 连接 。 该 连接 中 ， 要 连接 的 表 是 以 码 (key) 进行 排序 的 。 这 种 排序 可 以 通过 一 个 排序 方法 或 通 
过 索引 的 访问 来 实现 。 在 确保 外 部 表 和 内 部 表 的 序列 正确 以 后 ， 顺 序 读 取 每 个 表 ， 就 匹配 上 连接 列 了 。 在 合并 扫 摘 连 接 过 程 中 ， 
不 会 重复 读 取 任何 一 个 表 的 任何 行 。 当 其 中 一 个 表 (或 两 个 表 ) 没有 提供 合适 的 索引 时 ， 合 并 扫描 连接 非常 有 用 。 


根据 DBMS， 可 能 还 有 其 他 连接 方式 。 例 如 ， 支 持 数据 仓库 和 分 析 查 询 的 星 型 连接 ， 在 诸多 DBMS 中 就 是 一 种 典型 的 方式 。 


有 关 星 型 模式 和 星 型 连接 的 更 多 信息 ， 请 参阅 第 20 章 。 
连接 顺序 


优化 程序 会 对 查询 中 的 每 个 连接 进行 审查 并 对 相应 的 统计 信息 进行 分 析 ， 从 而 确定 表 的 最 佳 访问 顺序 以 完成 连接 。 为 了 找到 
最 佳 的 连接 访问 路 径 ， 优 化 程序 使 用 包含 连接 和 数据 量 知识 的 内 置 算法 。 这 种 智能 匹配 针对 连接 谓词 、 数 据 库 统 计 信息 和 可 用 的 
索引 ， 以 评估 哪 种 顺序 更 有 效 。 一 般 情况 下 ， 优 化 程序 部 署 的 算法 ， 将 最 大 程度 地 减少 为 了 符合 条 件 的 外 部 表 的 行 而 必须 访问 内 
部 表 的 次 数 。 然 而 ,没有 哪 种 关系 优化 程序 是 完美 的 。 


12.2.5 ”访问 路 径 选 择 
关系 优化 程序 创建 SQL 访 问 路 径 有 多 种 选择 。 前 面 已 经 讨论 过 连接 访问 路 径 ， 接 下 来 讨论 一 些 其 他 常见 的 数据 访问 吧 。 
表 扫 描 


表 要 措 是 最 简单 的 数据 访问 形式 。 只 需 通 过 读 取 表 的 每 一 行 来 执行 表 扫 摘 。 根 据 不 同 的 DBMS， 可 能 存在 另外 一 种 扫描 ， 叫 
做 表 空 间 扫 摘 。 表 空间 扫描 读 取 表 空间 中 的 每 一 个 页 面 ， 可 能 包含 多 个 表 。 显 然 ， 表 空间 扫描 比 表 扫 摘 的 速度 慢 ， 因 为 读 取 不 适 
用 的 数据 会 导致 额外 的 MO。 


表 扫 描 是 最 简单 的 数据 访问 形式 。 


另外 一 种 扫描 形式 是 分 区 扫描 。 如 果 DBMS 可 以 确定 要 访问 的 数据 存在 于 多 分 区 表 (或 表 空间 ) 的 某 些 分 区 ， 它 就 可 以 把 数 
据 扫 描 限 制 在 适当 的 分 多。 分 区 扫描 应 该 优 于 表 扫 描 或 表 空间 扫描 ， 因 为 所 需 的 |/O 量 减少 了 。 


通常 情况 下 ， 优 化 程序 选择 扫描 数据 是 由 于 : 
. 使 用 索引 不 能 满足 查询 的 需要 ， 可 能 是 因为 没有 索引 ， 没 有 谓词 匹配 索引 ， 或 谓词 妨 三 了 索引 的 使 用 。 


- 表 中 符合 条 件 的 行 所 占 的 比例 很 高 。 在 这 种 情况 下 ， 使 用 索引 的 效率 可 能 更 低 ， 因 为 大 多 数 的 数据 行 无 论 如 何 都 需要 读 
取 。 


< 匹配 谓词 的 索引 的 集群 比 很 低 ， 并 且 只 对 少量 的 数据 有 效 。 
* 表 太 小 ， 以 至 于 使 用 索引 反而 不 利 。 对 于 小 表 ， 添 加 索引 访问 到 表 访 问 可 能 会 导致 额外 的 I/O ， 而 不 会 减少 LI/O。 


为 了 帮助 扫描 性 能 的 提升 ， 优 化 程序 可 以 调用 数据 预 取 。 数 据 预 取 导 致 DBMS 在 请 求 数据 页 面 之 前 就 将 它们 顺序 读 取 到 数据 
的 高 速 缓存 中 。 从 本 质 上 来 讲 ， 数 据 预 取 是 一 种 预 读 取 机 制 ， 当 数据 扫描 开始 请 求 数据 时 ， 它 已 经 存在 于 内 人 存 中 了 。 数 据 预 取 对 
表 和 表 空 间 扫描 特别 有 用 ， 但 也 对 任何 顺序 数据 访问 有 一 定 的 实用 价值 。 数 据 预 期 是 否 有 用 ， 何 时 以 及 如 何 使 用 ， 都 取决 于 
DBMS。 优 化 程序 可 能 在 制定 访问 路 径 时 选择 部 署 数据 预 取 ， 也 可 能 在 查询 运行 时 打开 数据 预 取 。 作 为 一 名 DBA， 你 应 该 知道 如 
何 预 取 数据 以 及 为 什么 特定 的 DBMS 要 预 取 数 据 。 


数据 预 取 对 表 和 表 空 间 扫 描 特 别 有 用 。 
索引 访问 


在 优化 程序 必须 要 做 的 诸多 决定 中 ， 对 查询 性 能 最 重要 的 莫 过 于 是 否 使 用 索引 来 满足 查询 的 需要 。 为 了 确定 这 一 点 ， 优 化 程 


序 必 须 首先 找 出 索引 是 否 存 在 。 不 需要 在 编写 SQL 访问 列 之 前 定义 索引 ， 就 可 以 查询 数据 库 中 已 知 的 任何 表 的 任何 列 的 索引 。 

当然 ， 在 关系 优化 程序 使 用 索引 满足 查询 之 前 ， 适 当 的 索引 必须 已 经 人 存在。 此 外 ， 在 SQL 语句 的 索引 谓词 中 至少 要 引用 一 个 
索引 列 。DBMS 不 能 在 每 一 个 WHERE 子 句 中 都 使 用 索引 。 你 必须 要 知道 什么 样 的 谓词 可 以 使 用 索引 ， 以 确保 为 数据 库 查 询 创建 
的 索引 是 合适 的 。 每 个 DBMS 都 有 对 索引 的 要 求 ( 可 索引 和 不 可 索引 ) 。 此 外 ， 而 这 在 每 个 DBMS 版 本 中 往往 是 不 同 的 。 

关系 优化 程序 可 以 在 许多 不 同 的 方面 选择 使 用 索引 。 首 先 (也 是 最 简单 的 ) ， 索 引 访 问 的 类 型 是 直接 索引 查找 。 要 执行 直接 
索引 查找 ，DBM S 会 启动 以 下 步骤 : 

1.SQL 谓 词 中 的 值 与 存储 在 索引 根 页 中 的 值 进行 比较 。 基 于 这 种 比较 ，DBMS 将 遍历 索引 到 下 一 个 较 低 组 页 面 。 

2. 如 果 存 在 中 间 非 叶 级 页 ， 读 取 相 应 的 非 叶 级 页 ， 并 比较 其 中 的 值 以 确定 要 访问 哪个 叶 级 页 。 

3. 读 取 相应 的 叶 级 页 ， 索 引 叶 级 页 包含 指向 那些 符合 条 件 的 行 的 实际 数据 的 指针 。 

4. 基 于 该 叶 级 页 索引 条 目的 指针 ，DBMS 读 取 相 应 的 表 数 据 页 。 

最 简单 的 索引 访问 类 型 是 直接 索引 查找 。 

对 于 要 执行 直接 索引 查找 的 DBMS， 索 引 中 的 每 个 列 都 必须 有 值 。 例 如 ， 考 虑 下 面 的 查询 : 


SELECT last _ name, first_ name, middle_initial, empno 

FROM employee 

WHERE position = 'MANAGER' 

AND work_code = 1 

AND dept = '001000'; 

此 外 ， 假 设 列 “position”、“work_code” 和 “dept” 都 存在 索引 。DBMS 可 以 使 用 索引 和 每 一 列 谓词 中 的 值 进 行 直 接 
索引 查找 。 对 于 发 生 的 直接 索引 查找 ， 所 有 这 三 列 都 必须 出 现在 SQL 语句 中 。 如 果 只 指定 一 列 或 两 列 作为 谓词 ， 就 不 能 选择 直接 
索引 查找 ， 因 为 DBMS 无 法 匹配 所 有 的 索引 码 。 相 反 ， 可 以 选择 索引 扫描 。 回 想 一 下 前 面 有 关 表 和 表 空 间 扫 描 的 讨论 ， 索 引 扫 描 


很 类 似 ， 当 调用 索引 扫描 时 ， 该 索引 的 叶 级 页 将 按 顺 序 读 取 ， 一 个 接着 一 个 。 


有 两 种 基本 的 索引 扫描 : 匹配 索引 扫描 和 非 匹 配 素 引 扫 描 。 匹 配 索引 要 措 有 时 也 叫做 绝对 定位 。 它 开始 于 索引 的 根 页 ， 并 且 
以 类 似 于 直接 索引 查找 的 方式 扫描 到 叶 级 页 。 然 而 ， 由 于 没有 完整 的 索引 码 ，DBMS 必 须 对 索引 的 叶 级 页 进行 扫描 以 寻找 可 用 的 
值 ， 直 到 检索 到 所 有 匹配 的 值 。 图 12-3 显 示 了 匹配 索引 扫描 是 如 何 工作 的 。 


有 两 种 基本 的 索引 扫描 : 匹配 索引 扫描 和 非 匹配 索引 扫描 。 
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图 12-3 ”匹配 索引 扫描 


为 了 了 解 清楚 ， 考 虑 前 面 雇员 (employee) 表 的 查询 ， 但 这 一 次 查询 经 过 了 重新 编码 排除 了 “dept” 列 的 谓词 。DBMS 可 
以 使 用 匹配 索引 扫描 。 首 先 通 过 遍历 索引 定位 第 一 个 包括 列 “position” 和 “work_code” 相 应 值 的 叶 级 页 ， 从 根 开 始 。 然 而 ， 
可 能 会 有 多 个 索引 条 目 包含 这 些 值 的 组 合 和 不 同 于 “dept” 列 的 值 。 因 此 ， 叶 级 页 将 顺序 扫描 ， 直 到 | 发现 所 有 的 有 效 条 目 。 


对 于 请 求 的 匹配 索引 扫描 ， 你 必须 指定 索引 码 中 的 高 阶 列 ， 换 名 话说， 在 索引 DDL 中 指定 的 第 一 列 。 对 于 前 面 的 例子 ， 高 阶 
列 是 “position” 列 。 高 阶 列 为 DBMS 提 供 了 从 根 页 到 相应 的 叶 级 页 遍历 索引 结构 的 起 始点 。 


考虑 一 下 ， 如 果 查 询 中 没有 指定 高 阶 列 将 会 有 什么 后 果 。 例 如 ， 假 设 使 用 原来 的 查询 ,删除 “position” 的 谓词 但 是 保留 其 
他 两 列 的 谓词 ， 剩 下 的 SQL 语句 如 下 : 

SELECT last name, first_name, middle_initial, empno 

FROM employee 


WHERE work_code = 1 
AND dept = '001000'; 


在 这 种 情况 下 ，DBMS 可 以 部 署 非 匹配 索引 扫描 ， 有 时 也 称 作 相 对 定位 。 因 为 未 指 定 索 引 码 的 第 一 列 而 不 能 确定 扫描 的 起 始 
点 时 ，DBM 就 无 法 使 用 索引 树 结构 。 但 是 ， 它 可 以 使 用 索引 的 叶 级 页 ， 如 图 12-4 所 示 。 非 匹配 索引 扫描 从 索引 的 第 一 个 叶 级 
页 开始 ， 应 用 合适 的 谓词 按 顺序 扫 摘 随后 的 叶 级 页 。 
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图 12-4” 非 匹配 索引 扫描 
非 匹 配 索 引 扫 描 可 能 比 表 或 表 空 间 扫描 更 加 有 效 ， 特 别 是 如 果 必 须 访 问 的 数据 页 面 是 以 集群 的 顺序 排列 的 。 当 然 ， 非 匹配 索 
引 扫 摘 也 可 以 在 非 集群 索引 上 进行 。 
现在 有 两 种 索引 访问 : 集群 与 非 集群 。 前 面 有 关 索 引 访 问 的 任何 方法 都 适用 于 集群 和 非 集 群 访问 。 然 而 当 数 据 未 集群 时 ( 集 


群 索 引 访 问 ) ， 必 须要 访问 表 数 据 页 面 的 索引 扫描 不 可 能 非常 有 效 ， 因 为 它 是 逐个 叶 级 页 进行 的 ， 对 同一 个 数据 页 面 的 读 取 请 求 
绝 不 会 有 两 次 。 但 是 ， 非 集群 索引 访问 会 对 相同 的 数据 页 面 请 求 多 次 ， 因 为 数据 遍布 整个 表 。 对 于 集群 的 说 明 ， 请 参阅 第 4 章 和 
第 11 章 的 相关 讨论 和 图 表 。 


另外 可 以 部 署 的 索引 访问 技术 是 索引 屏蔽 。 有 了 索引 屏蔽 ， 匹 配 索引 扫描 就 可 以 在 多 列 索引 的 前 导 列 上 进行 ， 并 且 在 扫描 过 
程 应 用 其 他 谓词 。 当 没有 在 查询 中 指定 多 列 索 引 的 某 些 列 时 ， 这 种 技术 是 非常 有 用 的 。 看 另 一 个 查询 示例 。 
SELECT last_name, empno 
FROM employee 
WHERE position = 'MANAGER" 


AND work_code = 1 
AND salary > 50000.00; 


现在 假设 已 经 在 以 下 列 创 建 了 索引 ， 顺 序 如 下 : position、work code、dept 和 salary。 该 索引 可 以 通过 对 position 和 
work_code 应 用 匹配 索引 扫描 ， 并 通过 对 salary 列 中 那些 大 于 50000 美 元 的 值 指定 应 用 非 匹 配 索引 扫 擅 来 进行 筛选 ， 另 一 个 条 件 
是 与 “position= ‘MANAGER’ ”和 “work code=1” 谓 词 匹配 的 行 。 


其 中 最 有 效 的 索引 访问 是 唯一 索引 访问 ， 有 时 也 称 作 索引 夫差 。 再 次 考虑 刚刚 讨论 的 查询 。 此 外 ， 假 设 已 经 在 以 下 列 创 建 了 
索引 : position, work_code, dept, salary, last name 和 empno。 在 这 种 情况 下 ，DBMS 可 以 只 使 用 索引 来 满足 查询 的 需 
要 ， 因 为 所 有 请 求 的 数据 都 在 SELECT 列表 中 ， 并 且 所 有 的 谓词 都 在 索引 中 。 表 数据 页 面 不 需要 额外 的 MO。 


有 了 唯一 索引 访问 ，DBMS 可 以 通过 简单 扫描 索引 的 叶 级 页 来 满足 查询 。 非 匹配 唯一 索引 扫 拉 可 能 比 表 空 间或 表 扫描 的 速度 
更 快 ， 因 为 索引 条 目 一 般 少 于 表 的 行 ， 从 而 每 次 VO 可 以 读 取 更 多 的 数据 。 


覆盖 索引 包含 满足 查询 所 需 的 所 有 数据 ， 而 不 需要 访问 表 。 


为 了 鼓励 唯一 索引 访问 ，DBA 可 以 通过 添加 出 现在 SQL 语句 SELECT 列表 中 的 其 他 列 来 使 索引 超载 。 这 么 做 可 以 得 到 较 大 的 
性 能 回报 ， 代 价 是 额外 的 磁盘 存储 需求 ， 因 为 又 有 额外 的 列 被 索引 。 


最 后 一 种 索引 访问 是 多 索引 访问 。 有 了 多 索引 访问 ，DBMS 可 以 使 用 一 个 以 上 的 索引 来 满足 单一 的 访问 路 径 。 例 如 ， 考 虑 雇 
员 (employee) 表 查 询 的 另 一 种 变化 : 


SELECT ast_name, empno 
FROM employee 

WHERE position = 'MANAGER' 
AND work_code = 1; 


有 了 多 索引 访问 ，DBMS 可 以 使 用 一 个 以 上 的 索引 来 满足 单一 的 访问 路 径 。 


现在 有 两 个 索引 : 一 个 在 Position 列 ， 而 另 一 个 在 work_code 列 。 该 查询 指定 了 两 个 谓词 ， 其 中 每 个 谓词 都 分 别 受 不 同 索引 
的 支持 。 关 系 优化 程序 可 以 将 两 个 索引 结合 起 来 (而 不 是 选择 任何 一 个 索引 ) ， 有 效 地 返回 正确 的 数据 。 


有 两 种 多 索引 访问 ， 这 取决 于 谓词 是 使 用 AND 还 是 OR 捆绑 在 一 起 。 有 些 DBMS 只 支持 AND 风 辑 操作 符 ， 而 有 些 则 同时 支持 
AND 和 OR。 在 某 些 情 况 下 ，DBA 可 以 通过 部 署 多 个 单列 索引 (而 不 是 多 个 多 列 索引 ) 来 最 大 程度 地 减少 创建 的 索引 数量 。DBA 
在 做 决定 时 应 考虑 DBMS 使 用 多 索引 访问 的 效率 和 正在 部 署 的 应 用 程序 的 性 能 需求 。 


(1) 使 用 索引 来 避免 排序 


DBMS 可 能 需要 对 数据 进行 排序 以 满足 SQL 的 请 求 。 排 序 的 成 本 相当 昂贵 ， 如 果 可 能 应 尽量 避免 。 通 过 在 需要 排序 的 列 上 创 
建 索 引 ，DBA 可 以 使 用 这 些 索引 来 避免 排序 。 关 系 优 化 程序 将 使 用 索引 来 尽 可 能 地 避免 排序 。 指 定 以 下 子 句 时 可 能 会 用 到 排 
序 : 


- DISTINCT: 当 指 定 此 子 句 时 ，DBMS 要 求 结 果 数 据 的 每 一 列 排序 到 位 ， 以 便 可 以 从 结果 集 删 除 重 复 的 行 。 


- UNION: 此 操作 需要 每 个 SELECT 列表 中 的 列 排 序 到 位 ， 因 为 结果 集 可 能 没有 重复 的 行 。 如 果 DBMS 支 持 INTERSECT 和 
EXCEPT， 同 样 的 考虑 也 适用 于 这 些 操作 。 


- GROUP BY: 当 指 定 此 子 句 时 ，DBMS 要 求 数 据 通过 指定 的 列 进行 排序 ， 以 便 汇 总 数据 。 
- ORDER BY: 当 指 定 此 子 名 时 ，DBMS 将 确保 结果 集 是 通过 哪些 指定 的 列 进行 排序 的 。 
通过 在 需要 进行 排序 的 列 上 创建 索引 ，DBA 可 以 使 用 这 些 索 引 来 避免 排序 。 


SELECT Jast_name, first_name, middle_initial, empno, position 
FROM employee 

WHERE position in ('MANAGER', 'DIRECTOR', 'VICE PRESIDENT') 
ORDER BY last_name; 


如 果 last_name 列 有 索引 ， 查 询 可 以 使 用 这 个 索引 ， 从 而 避免 排序 。 使 用 索引 来 避免 排序 是 对 以 下 两 个 因素 进行 权衡 之 后 的 
结果 : 排序 所 需 的 额外 CPU 成 本 和 索引 访问 所 需 的 额外 MO 成 本 。 当 然 ， 如 果 无 论 如 何 都 要 使 用 索引 ， 这 个 选择 就 很 容易 了 。 使 
用 索引 的 速度 是 否 真 的 比 扫描 数据 和 排序 的 速度 更 快 ， 取 决 于 : 


符合 条 件 行 的 数量 。 
-排序 的 速度 。 


-索引 的 特性 〈 例 如 ， 集 群 或 非 集群 ) 。 


此 外 ， 编 写 指定 了 UNION 操 作 的 查询 时 ， 一 定 要 仔细 研究 应 用 程序 的 需求 。 如 果 没 有 重复 的 行 ， 或 者 你 不 在 乎 结果 集中 是 
否 存在 重复 ， 你 也 可 以 指定 UNION ALL 来 避免 为 删除 重复 行 而 进行 的 排序 。 


(2) 为 什么 之 前 没有 用 索引 选择 (index selection) 


有 时 会 出 现 这 样 的 情况 ， 优 化 程序 本 应 选择 使 用 一 个 索引 而 它 却 没有 用 。 任 何 一 个 原因 都 会 导致 优化 程序 没有 使 用 索引 。 下 
面 给 出 了 使 用 索引 选择 方式 时 要 考虑 的 因素 : 


* 该 查询 是 否 指 定 了 搜索 参数 ? 如 果 没有 谓词 使 用 搜索 参数 ， 优 化 程序 就 不 能 使 用 索引 来 满足 该 查询 。 
“ 是 否 连接 了 大 量 的 表 ? 当 连 接 大 量 的 表 时 ， 某 些 DBMS 的 优化 程序 可 能 会 产生 不 可 预知 的 查询 计划 结果 。 


* 是 当前 的 统计 信息 吗 ? 如 果 插 入 、 更 新 和 (或 ) 删除 了 大 量 的 数据 ， 应 重新 捕获 数据 库 的 统计 信息 ， 从 而 确保 优化 程序 有 
最 新 的 信息 来 进行 查询 计划 。 


* 是 否 在 使 用 存储 过 程 ?》 有 时 ，DBMS 会 提供 存储 过 程 的 选项 (一 旦 编译 完成 ) ， 不 会 为 后 续 的 执行 而 改写 查询 计划 。 你 可 
能 需要 对 存储 过 程 进行 重新 编译 或 重新 优化 ， 以 便 充 分 利用 最 新 的 统计 信息 、 新 的 索引 或 任何 其 他 相关 的 数据 库 变更 。 


: 是 否 需 要 额外 的 谓词 98 不同 的 WHERE 子 名 可 能 使 优化 程序 考虑 不 同 的 索引 。 


散 列 访问 


制定 访问 路 径 时 ， 优 化 程序 也 将 考虑 使 用 任何 现 有 的 放 列 结构 。 逆 列 (或 散 列 函数 ) 是 一 种 将 码 (一 列 或 多 列 ) 转换 成 小 数 
(small number) 的 算法 ,通常 是 磁盘 上 的 一 个 存储 位 置 。 散 列 函 数 返回 的 值 叫做 散 列 值 、 散 列 总 和 或 简单 的 散 列 值 。 


图 12-5 描 述 了 一 个 散 列 浮 数 。 码 经 过 散 列 算法 〈 也 称 为 散 列 函数 、 散 列 例 程 或 随机 数 发 生 器 ) 的 处 理 转换 成 一 个 存储 位 
置 。 插 入 数据 时 ， 散 列 算法 告诉 DBMS 将 数据 以 物理 的 方式 存储 在 什么 地 方 ， 通 过 码 访问 数据 时 ， 散 列 算 法 告诉 DBMS 在 什么 地 
方 可 以 找到 数据 。 


散 列 将 码 转 换 成 一 个 存储 位 置 。 


码 
(e.g.,LAST NAME) 


BLAKE 
JACKSON 
JOHNSON 


存储 位 置 


JOHNSON 


JACKSON 


A12-5 ” 散 列 操作 


散 列 甚至 比 直接 索引 查找 的 效率 更 高 ， 因 为 通常 它 导 致 的 /O 较 少 。 散 列 将 码 转 换 成 磁盘 上 的 一 个 具体 位 置 ， 而 不 必 遍 历 多 
个 索引 页 面 (从 根部 经 过 非 叶 级 页 到 叶 级 页 ， 然 后 到 数据 ) 。 最 理想 的 情况 ， 这 只 导致 一 次 V/O。 如 果 多 个 码 由 散 列 算法 产生 的 
位 置 相同 ， 就 会 发 生 散 列 冲突 ， 这 也 需要 额外 的 MO。 图 12-5 显 示 了 当 码 NEELD 传 递 给 散 列 算法 时 产生 的 冲突 。 


散 列 主要 用 于 优化 少量 数据 的 随机 lI/O， 比 如 ， 查 找 代码 表 的 值 或 基于 主 码 的 值 访问 单个 行 。 
并 行 访问 

关系 优化 程序 可 能 选择 并 行 运行 查询 。 当 DBMS 调 用 并 行 查询 时 ， 也 会 调用 多 个 同时 发 生 的 任务 来 访问 数据 。DBMS 支 持 三 
种 基本 的 并 行 : 


"I/O 并行: 支持 单个 查询 发 起 并 发 I/O 流 。 运 行 并行 I/O 任 务 可 以 显著 提升 IJ/O 绑 定 查 询 的 性 能 。 将 查询 的 数据 访问 分 解 为 
并 行 执行 的 IO 流 可 以 减少 查询 的 整体 运行 时 间 。 


- CPU 并 行 : 支持 查询 内 的 CPU 多 任务 处 理 。 调 用 CPU 并 行 也 就 是 调用 了 I/O 并 行 ， 因 为 每 个 CPU 引擎 都 需要 各 自 的 I/O 流 。 
CPU 并 行将 查询 分 解 为 可 以 在 多 个 处 理 器 上 同时 运行 的 多 个 较 小 的 查询 。CPU 并 行 可 以 进一步 减少 查询 的 整体 运行 时 间 。 


- 系统 并 行 : DBMS 可 以 部 署 系统 并 行 来 进一步 提升 并 行 查询 操作 。 系 统 并 行 打破 了 单个 查询 ， 使 查询 可 以 跨 多 个 DBMS 实 
例 运行 。 允 许 单个 查询 充分 利用 多 个 DBMS 实 例 的 处 理 能 力 ， 可 以 进一步 减少 复杂 查询 的 整体 运行 时 间 。 


DBMS 支 持 三 种 基本 的 并 行 : IJO、CPU 和 系统 。 


确保 使 用 正确 的 索引 用 法 制定 适当 的 查询 计划 是 一 个 非常 耗 时 的 过 程 ， 但 可 以 使 性 能 得 到 极 大 提升 。DBA 应 该 培训 应 用 程 
序 开发 人 员 了 解 天 系 优化 ， 并 创建 最 佳 的 SQL。 当 然 ， 应 用 程序 开发 人 员 的 责任 是 编写 有 效 的 SQL 和 程序 逻辑 。 但 DBA 是 关系 数 
据 库 性 能 的 哨兵 。 发 生性 能 问题 时 ，DBA 负 责 找到 问题 的 原因 ， 并 提出 解决 问题 的 补救 措施 。 此 外 ，DBA 还 应 引导 设计 审查 ， 
在 不 理想 的 访问 路 径 和 程序 迁移 到 生产 状态 之 前 ， 找 出 并 调整 低 效 的 SQL。 


12.3 ”其 他 优化 考虑 


优化 程序 做 出 的 关于 SQL 查询 以 何 种 方式 访问 数据 的 其 他 决定 也 会 对 性 能 产生 影响 。 本 节 将 对 这 些 优化 考虑 进行 讨论 。 


12.3.1 ”视图 访问 
优化 查询 过 程 中 必须 做 出 的 决定 之 一 是 如 何 通 过 视图 访问 数据 。 记 得 第 4 章 中 曾经 提 到 ， 视 图 是 使 用 SQL 定 义 的 表 的 一 种 远 
辑 表示 。 因 此 ， 访 问 视图 的 查询 基本 上 是 一 个 嵌入 其 他 SQL 语句 中 的 SQL 语句 。 


当 优 化 程序 确定 包含 视图 查询 的 访问 路 径 时 ， 还 必须 确定 如 何 解决 视图 SQL。 请 记 住 ， 无 论 访问 视图 还 是 访问 视图 的 SQL， 
都 可 能 引用 了 多 个 表 和 其 他 视图 。 


有 两 种 方法 都 可 以 优化 那些 引用 了 视图 的 SQL: 视图 合并 和 视图 实体 化 。 其 中 更 有 效 的 是 视图 合并 。 顾 名 思 义 ， 部 署 视图 合 
并 时 ， 视 图 DDL 中 的 SQL 与 引用 该 视图 的 SQL 合并 在 一 起 。 然 后 ， 合 并 后 的 SQL 用 来 制定 视图 基 表 的 访问 路 径 。 


视图 合并 和 视图 实体 化 可 以 用 来 优化 那些 引用 了 视图 的 SQL。 


访问 视图 的 第 二 种 技术 是 视图 实体 化 。 当 优化 程序 不 能 合并 视图 中 的 SQL 和 访问 该 视图 的 SQL 时 ， 它 会 创建 一 个 中 间 工 作文 
件 来 保存 视图 的 结果 。 然 后 ,访问 视图 的 SQL 会 在 这 个 包含 视图 数据 的 工作 文件 中 运行 。 视 图 实体 化 并 不 像 视 图 合并 那样 有 效 ， 
因为 数据 的 检索 和 存储 都 必须 在 一 个 临时 的 工作 文件 中 进行 。 


必须 使 用 视图 实体 化 而 不 是 视图 合并 时 ， 每 个 DBMS 都 有 自己 的 一 套 规则 。 一 般 来 说 ， 当 需要 调用 列 函 数 或 排序 操作 时 ， 往 
往 需 要 视图 实体 化 。 


12.3.2 Bes 


一 些 关 系 优 化 程序 足够 智能 ， 它 们 可 以 在 优化 过 程 中 有 效 地 重 写 SQL。 例 如 ， 优 化 程序 可 能 将 一 个 子 查询 转换 成 等 价 的 连 
接 。 或 者 ， 也 可 能 尝试 等 价 却 不 同 的 谓词 公式 来 确定 哪个 可 以 创建 更 优 的 访问 路 径 。 例 如 ， 由 于 下 面 语句 中 两 个 谓词 是 等 价 的 ， 
优化 程序 可 能 分 别 以 两 种 方式 来 重 写 查询 ， 看 看 哪 一 个 可 以 产生 更 优 的 访问 路 径 : 


WHERE columnl >= 1 AND columnl1 <= 100 
WHERE column1 BETWEEN 1 AND 100 


此 外 ， 优 化 程序 可 以 通过 创建 推断 谓词 来 重 写 查询 。 谓 词 传递 闭 包 就 是 这 方面 的 一 个 例子 ， 优 化 程序 将 一 个 谓词 添加 到 查询 


中 用 以 提高 性 能 。 考 虑 下 面 的 SQL 语句 : 


SELECT d.dept_name, e.last_name, e.empno 
FROM employee e, 
department d 
WHERE e.deptno = d.deptno 
AND d.deptno = '808'; 


该 SQL 语句 在 功能 上 等 价 于 下 面 的 SQL 语句 : 


SELECT d.dept_name, e.last_name, e.empno 
FROM employee e, 
department d 
WHERE e.deptno = d.deptno 
AND e.deptno = '808'; 


唯一 的 区 别 是 第 二 个 谓词 ， 但 由 于 deptno 在 两 个 表 中 是 相同 的 (由 于 第 一 个 连接 谓词 ) ， 从 employee 表 或 department 表 
检查 deptno 都 可 以 。 但 是 ， 可 能 在 性 能 方面 会 有 差异 。 例 如 ， 一 个 索引 可 能 存在 于 其 中 一 个 deptno 列 ， 或 者 其 中 一 个 表明 显 比 
另 一 个 大 。 通 常 ， 谓 词 应 用 在 较 大 的 表 时 ， 查 询 的 效率 会 更 高 ， 因 为 符合 条 件 的 行 的 数量 减少 了 。 


如 果 优化 程序 可 以 执行 谓词 传递 闭 包 ，SQL 开 发 人 员 就 没有 必要 为 此 担心 了 。 优 化 程序 将 考虑 两 列 的 访问 路 径 ， 无 论 是 以 哪 
个 谓词 进行 的 编码 。 在 本 质 上 ， 优 化 程序 将 重 写 查询 ， 用 以 添加 宛 余 的 谓词 。 


DBA 应 该 查 明 在 用 的 关系 优化 程序 是 否 可 以 执行 任何 形式 的 查询 重 写 。 此 外 ， 什 么 类 型 的 查询 规则 可 以 重 写 ， 每 个 DBMS 和 
每 个 优化 程序 都 可 能 不 同 。 例 如 ， 优 化 程序 可 能 无 法 执行 一 些 谓词 上 的 谓词 传递 闭 包 ， 如 IN 或 LIKE 子 句 。 


什么 类 型 的 查询 规则 可 以 重 写 ，DBMS 和 优化 程序 可 能 不 同 。 


12.3.3 ”基于 规则 的 优化 

到 现在 为 止 ， 前 面 的 讨论 都 集中 在 基于 成 本 的 优化 。 大 多 数 的 关系 优化 程序 是 基于 成 本 的 ， 这 意味 着 它们 的 访问 路 径 制定 决 
策 基 于 对 成 本 的 估算 。 成 本 较 低 的 访问 路 径 比 昂贵 的 访问 路 径 更 受 青 睐 。 

然而 ， 有 些 DBMS 支 持 的 优化 是 基于 启发 式 方 法 或 规则 的 。 例 如 ，Oracle 提 供 了 基于 成 本 和 基于 规则 的 优化 。 

Oracle 提 供 了 基于 成 本 和 基于 规则 的 优化 。 


基于 规则 的 优化 程序 的 优化 决策 基于 SQL 语法 和 结构 、 谓 词 的 位 置 、SELECT 语 句 中 表 的 顺序 ， 以 及 可 用 的 索引 。 有 了 基于 
规则 的 优化 程序 ，SQL 开 发 人 员 在 编写 SQL 时 就 必须 牢记 这 些 规则 。 只 需 对 SELECT 列表 中 的 列 或 FROM 子 句 中 的 表 进 行 重新 排 
序 ， 查 询 的 性 能 就 可 能 受到 影响 。 


基于 成 本 的 优化 是 DBMS 的 趋势 ， 因 为 SQL 语 句 的 编写 不 需要 遵循 一 套 深奥 的 “规则 ”。 此 外 ， 优 化 程序 估算 不 同 访问 路 径 
的 成 本 而 产生 的 有 效 查询 执行 计划 更 为 可 靠 。 


12.4 ”访问 路 径 的 审查 


程序 员 或 DBA 可 以 检查 关系 优化 程序 选择 的 访问 路 径 。 完 成 这 项 工作 的 命令 和 过 程 取决 于 DBMS。 通 常 ， 外 部 化 访问 路 径 的 
命令 是 EXPLAIN 或 SHOWPLAN。 无 论 名 称 如 何 ， 一 般 的 过 程 如 图 12-6 所 示 。 


EXPLAIN 如 何 工 作 


绑 定 或 


EXPLAIN 优化 程序 目录 


统计 信息 


请 求 


访问 路 径 


图 12-6 EXPLAIN #2 


Microsoft SQL Server 和 Sybase 使 用 的 命令 叫做 SHOWPLAN。 图 12-7 提 供 了 访问 路 径 的 文本 摘 述 ， 图 12-8 提 供 了 访问 路 
径 的 图 形状 描述 。 


Oracle 和 DB2 使 用 了 不 同 的 方法 ， 即 EXPLAIN 声 明 。 当 SQL 语 句 以 EXPLAIN 命 令 为 前 绎 时 ， 由 优化 程序 确定 的 访问 路 径 信 
息 就 会 写 入 一 个 叫做 PLAN_TABLE 的 表 中 。 然 后 ， 程 序 员 或 DBA 可 以 查询 该 PLAN_TABLE 来 解释 优化 程序 指定 的 访问 路 径 。 


EXPLAIN 可 以 逐个 语句 地 执行 ， 也 可 以 针对 整个 应 用 程序 。 


F lect title id, title, price, type 
from titles 
here price > 5.00 


affected) 


|--Clustered Index Scan(pubs..titles.UPKCL titleidind, WHERE: (titles.price>Convert (@1))) 


t shovplan text on 


lect title id, title, price, type 
from titles 
here price > 5.00 


Clustered Index Scan 
ó, Scanning a clustered index, entirely or only a range. 


Argument: : 
ang, Sue ml ee WHERE: [titles pice) Conver 


12-8 SHOWPLAN 的 图 形 化 例子 


例如 ， 考 虑 下 面 的 SQL 语句 : 


EXPLAIN plan SET STATEMENT_ID = ‘emptest' FOR 

SELECT position, last_name, first_name, middle_initial, empno 
FROM employee 

WHERE position IN ('MANAGER', 'DIRECTOR', ‘VICE PRESIDENT') 
ORDER BY position; 


由 于 SELECT 语句 以 EXPLAIN 命 令 为 前 缀 ， 关 系 优化 程序 将 访问 路 径 的 信息 外 部 化 到 PLAN_TABLE 中 。STATEMENT_ID 子 句 
提供 了 一 个 标识 符 ， 用 来 定位 SQL 语句 在 PLAN_TABLE 中 的 访问 路 径 。PLAN_TABLE 包 含 了 数据 的 编码 列 ， 概 述 了 所 使 用 的 查询 
访问 路 径 的 本 质 ， 比 如 : 


“ 是 否 使 用 了 索引 ? 如 果 是 ， 使 用 了 多 少 个 ? 
.索引 中 有 多 少 列 匹配 查询 ? 

- 是 否 使 用 了 唯一 索引 访问 ? 

` 使 用 了 什么 连接 方法 ? 


. 是 否 使 用 了 并 行 访问 ? 


当然 ， 对 于 Oracle 和 DB2,， 确切 的 列 以 及 这 些 列 所 允许 的 值 可 能 不 同 。 


访问 路 径 分 析 工 具 ， 解 释 PLAN_TABLE 并 显示 英文 文本 和 图 形 化 访问 路 径 描 述 ， 也 可 用 于 Oracle 和 DB2。 例 如 ， 如 图 12-9 
所 示 ， 查 看 由 Visual Explain 工 具 的 图 形 化 输出 。 这 样 的 SQL 分 析 工 具 经 常 可 以 就 如 何 解决 效率 低下 的 SQL 语句 提供 专家 级 的 调 
整 建议 。 如 果 有 必要 ， 分 析 工 具 可 以 使 DBA 分 析 中 使 用 的 访问 路 径 和 调整 SQL 变 得 更 加 容易 。 
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图 12-9 Visual Explain 工 具 


分 析 工 具 可 以 使 DBA 分 析 中 使 用 的 访问 路 径 变 得 更 加 容易 。 


强制 访问 路 径 


有 些 DBMS 人 允许 你 强制 特定 访问 路 径 的 用 法 或 表 连 接 的 顺序 。 例 如 ，Microsoft SQL Server 提 供 了 FORCEPLAN 选 项 ， 该 选 
项 设置 成 ON 时 ， 优 化 程序 将 以 表 在 SQL 语 句 中 的 编码 顺序 对 它们 进行 连接 。 


另 一 方面 ，Oracle 提 供 相 关 的 提示 ， 可 以 用 来 引导 关系 优化 程序 选择 特定 的 访问 路 径 。 提 示 直 接 在 SQL 查询 中 指定 ， 嵌 入 
在 “/*+” 和 “” ”之 间 ， 例 如 : 


SELECT /*+ USE_NL */ 
e.position, e.last_name, e.empno, d.manager 
FROM employee e, 
department d 
WHERE d.dept_id = e.dept_id 
AND position IN ('MANAGER', 'DIRECTOR', 'VICE PRESIDENT') 
ORDER BY position; 


该 查询 使 用 了 Oracle 的 提示 “USE_NL” 进 行 强制 嵌 套 循环 连接 。 可 以 提供 的 其 他 提示 还 可 以 强制 索引 的 选择 ， 强 制 并行 的 
用 法 或 强制 其 他 优化 目标 。 


强制 访问 路 径 选择 标准 的 技术 应 愤 用 。 通 常 ， 最 好 让 关系 优化 程序 自主 选择 适当 的 访问 路 径 ， 除 非 : 


“ 你 对 要 连接 的 表 所 存储 的 数据 量 和 数据 类 型 有 深入 的 了 和 解 。 
- 你 有 理由 相信 ， 与 优化 程序 相 比 ， 你 可 以 更 好 地 确定 最 佳 的 连接 顺序 。 
* 数据 库 的 统计 信息 不 是 最 新 的 ， 因 此 优化 程序 并 没有 提供 有 关 数 据 库 环境 的 充足 信息 。 


蔡 代 的 方法 是 ， 鼓 励 优化 程序 选择 不 同 的 访问 路 径 。 一 般 鼓励 访问 路 径 选 择 的 方法 是 ， 在 深入 了 解 关 系 优化 程序 的 基础 上 对 
SQL 进行 修改 。 这 有 时 也 叫做 调整 SQL。 由 于 每 个 DBMSs 的 优化 程序 都 有 很 大 区 别 ， 所 以 几乎 不 会 用 到 跨 多 个 DBMS 进 行 SQL 调 


Re 


替代 的 方法 是 可 以 鼓励 优化 程序 选择 不 同 的 访问 路 径 。 

一 种 常见 的 调整 SQL 的 方法 是 改变 查询 ， 这 样 结果 是 相同 的 ， 但 是 优化 程序 不 能 使 用 某 些 访问 路 径 。 例 如 ， 考 虑 下 面 的 SQL 
语句 : 

SELECT Jast_name, first_name, empno, deptno 

FROM employee 

WHERE empno BETWEEN '001000' AND '009999' 

AND (salary > 50000.00 OR 0 = 1) 


ORDER by last_name; 


有 或 没有 最 后 一 个 谓词 的 “OR 0=1” 部 分 ， 这 个 查询 的 结果 是 完全 一 样 的 。 然 而 ， 有 些 DBMSs 产 品 蔡 止 索引 使 用 这 样 的 查 
询 公 式 。 在 这 种 情况 下 ， 加 上 “OR 0=1” 将 消除 使 用 索引 支持 谓词 salary 的 可 能 性 。 
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DBA 必 须 了 解 那些 对 其 所 管理 的 每 个 DBMS 有 意义 的 SQL 调整 和 调整 类 型 的 基本 面 。 此 外 ， 无 论 何 时 部 署 这 样 的 调整 ， 一 定 
要 全 面 记录 原因 。 如 果 没 有 这 样 的 文档 ， 负 责 维 护 的 程序 员 很 有 可 能 会 将 “OR 0=1” (或 任何 其 他 调整 ) 删除 ， 因 为 它 不 是 必 


需 的 。 


DBA 必 须 了 解 SQL 调整 的 基本 面 。 


12.5 SQL 的 编码 和 调 优 效率 


SQL 编码 和 调 优 是 一 项 最 耗 时 的 DBA 任 务 。 可 能 有 成 十 上 万 的 单个 SQL 语句 分 布 在 访问 数据 库 的 数 百 个 应 用 程序 中 。DBA 负 
责 确 保 对 企业 中 的 每 个 SQL 语句 都 进行 以 下 步骤 : 


1. 确 定 业务 数据 需求 。 

2. 确 保 现 有 的 数据 库 中 的 所 需 数据 可 用 。 
3. 将 业务 需求 转换 成 SQL。 

4. 对 SQL 的 准确 性 和 结果 进行 测试 。 
5. 查 看 访问 路 径 的 性 能 。 

6. 调 整 SQL， 使 其 具有 更 好 的 访问 路 径 。 


7. 对 优化 提示 进行 编码 。 


8. 重 复 步 骤 4~7， 直 到 性 能 可 以 接受 。 
9. 出 现 性 能 问题 或 安装 新 的 DBMS 版 本 时 ， 重 复 步骤 8。 
10,. 业 务 需 求 发 生变 更 时 ， 重 复 整 个 过 程 。 


SQL 调 优 确实 是 一 个 非常 复杂 、 耗 时 上 且 容 易 出 错 的 过 程 。 此 外 ， 前 三 步 还 需要 业务 用 户 和 应 用 编程 人 员 之 间 进 行 合 作 和 沟 
， 其 余 步骤 则 需要 应 用 编程 人 员 和 DBA 进 行 合作 和 沟通 。 
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但 是 ， 可 以 肯定 的 是 ， 一 定 有 一 种 方法 可 以 简化 SQL 调 优 。 


12.5.1 SQLS ANSE 
本 节 将 对 一 些 通常 只 适用 于 SQL 开发 而 与 基础 DBMS 无 关 的 经 验 法 则 进行 研究 . 


法 则 1: “看 情况 而 定 ” 


有 关 数 据 库 性 能 的 每 一 个 问题 的 答案 都 是 “看 情况 而 定 ”。 成 功 的 DBA 知 道 看 什么 情况 。 例 如 ， 如 果 有 人 问 “ 我 的 SQL 查询 
的 最 佳 访问 路 径 是 什么 ) ” ， 最 好 的 答案 是 “看 情况 而 定 ”。 为 什么 ”如 果 每 一 行 都 要 返回 ， 表 扫描 可 能 比索 引 访问 的 效率 更 
高 ; 但 是 ， 如 果 只 有 一 行 需要 返回 ， 执 行 直接 索引 查找 可 能 最 好 ; 而 如 果 碍 询 需要 返回 的 行 在 一 到 所 有 行 之 间 ， 访 问 路 径 的 性 能 
将 取决 于 数据 如 何 集群 ， 在 用 的 DBMS 是 哪个 版 本 ， 以 及 是 否 可 以 调用 并 行 ， 等 等 。 


成 功 的 DBA 知 道 看 什么 情况 。 
对 使 用 词 “ 总 是 ”或 “从 不 ”的 微调 提示 持 怀疑 态度 。 因 为 几乎 一 切 事物 都 依赖 其 他 事物 。 
法 则 2: 谨慎 对 待 你 所 求 
查询 中 要 素 的 排列 可 以 改变 查询 的 性 能 。 改 变 的 程度 取决 于 在 用 的 DBMS 以 及 是 否 使 用 了 基于 规则 的 优化 。 


好 的 经 验 法 则 ， 无 论 什 么 DBMS， 会 把 最 严格 的 谓词 放 在 优化 程序 最 先 读 取 的 地 方 。 在 Oracle 中 ， 优 化 程序 从 底部 往 上 读 取 
WHERE 子 句 ， 因 此 ， 最 严格 的 谓词 应 放 在 查询 的 底部 。DB2 则 刚好 相反 。 


将 最 严格 的 谓词 放 在 优化 程序 最 先 读 取 的 地 方 。 


将 最 严格 的 谓词 放 在 优化 程序 最 先 读 取 的 地 方 ， 使 优化 程序 在 继续 下 一 个 谓词 之 前 ， 可 以 缩小 第 一 组 结果 的 范围 。 下 一 个 谓 
词 将 应 用 到 由 最 具 选 择 性 的 条 件 选 择 的 数据 的 子 集 ， 而 不 是 整个 表 。 


法 则 3: KISS 
所 有 类 型 的 IT 活动 的 经 验 法 则 都 遵循 Klss 原 则 : 简单 点 。 然 而 ， 在 SQL 的 世界 ， 需 要 对 简单 和 性 能 进行 权衡 。 
简单 点 。 


SQL 越 简单 ， 其 开发 和 维护 任务 就 越 容易 。 简 单 的 SQL 语句 更 容易 解释 ， 也 更 容易 变更 。 应 用 程序 开发 人 员 使 用 简单 的 SQL 
比 使 用 复杂 的 SQL 更 容易 开展 工作 。 


然而 ， 复 杂 的 SQL 也 可 以 超越 简单 的 SQL。DBMS 和 优化 程序 执行 的 工作 越 多 ， 性 能 可 能 就 越 好 。 下 面 看 一 个 例子 : 有 些 程 
序 员 通 过 编写 多 个 SQL SELECT 语句 ， 并 使 用 程序 逻辑 连接 数据 来 避免 连接 。SQLk 比 较 简 单 ， 因 为 程序 员 不 需要 知道 如 何 编写 
SQL 来 连接 表 。 然 而 ，SQL 连 接 通 常会 超越 程序 连接 ， 因 为 返回 到 程序 的 数据 较 少 。 此 外 ， 如 果 数 据 库 或 数据 发 生变 化 ， 优 化 程 
序 可 以 自动 改变 连接 的 方法 。 相 反 ， 程 序 逻辑 必须 由 熟练 的 程序 员 手 动 改变 。 
法 则 4: 只 检索 必需 的 


这 个 法 则 就 像 听 起 来 那样 简单 ， 你 可 能 会 惊讶 这 简直 是 强人 所 难 。 为 了 最 大 程度 地 减少 SQL 语句 返回 的 数据 量 ， 一 定 要 在 
SELECT 列表 中 指定 绝对 少 的 行 数 。 如 果 某 列 不 能 满足 业务 需求 ， 就 不 要 求 它 返回 到 结果 集中 。 


在 SELECT 列表 中 指定 绝对 少 的 行 数 。 


程序 员 经 常会 复制 那些 好 用 的 SQL 语句 作为 新 语句 的 模板 。 有 时 ， 他 们 会 忘记 减少 要 求 的 列 数 ， 而 这 些 列 数 只 在 原始 查询 的 
列 的 子 集中 需要 。 这 可 能 会 对 性 能 产生 严重 的 影响 。DBM S 需 要 返回 的 列 越 多 ， 处 理 开 销 就 越 大 。 


另外 一 个 常见 的 问题 是 请 求 不 必要 的 数据 。 看 看 下 面 的 SQL 语句 : 


SELECT position, last_name, empno 
FROM employee 
WHERE last_name = 'SMITH'; 


没有 必要 在 这 个 SQL 语句 的 SELECT 列表 中 指定 last_name 列 。 由 于 使 用 了 WHERE 子 句 ， 整 个 结果 集 的 last_name 必 须 是 
SMITH。 


当 程 序 员 选 择 了 一 列 ， 只 是 因为 他 们 想 在 ORDER BY 子 句 中 对 它 进行 排序 ， 以 上 类 似 的 问题 也 可 能 出 现 。 许 多 DBM 9 产品 不 
需要 为 了 在 ORDER BY 子 句 中 使 用 而 选择 列 。 唯 一 应 选择 的 列 是 那些 驱动 该 查询 的 商业 目的 所 需 的 列 。 


只 返回 必需 的 并 不 只 适用 于 列 。 你 还 应 通过 为 每 个 SQL 语句 编写 合适 的 WHERE 子 句 来 尽量 减少 返回 的 行 数 。DBMS 的 结果 
集 过 滤 掉 的 数据 越 多 ， 碍 询 的 效率 就 越 高 ， 因 为 必须 要 返回 的 数据 越 少 。 


有 时 程序 员 会 避免 编写 适当 的 WHERE 子 句 ， 希 望 借 此 简化 SQL 语句 。 优 化 程序 得 到 检索 数据 的 信息 越 多 ， 访 问 路 径 的 制定 
就 越 好 。 潜 在 滥用 的 一 个 肯定 的 标志 就 是 发 现 伐 入 应 用 程序 中 的 SQL 语句 后 面 紧 跟着 一 连 串 的 IF-THEN-ELSE 语 句 。 可 以 将 这 些 
IF-THEN-ELSE 语 句 移 到 SQL 的 WHERE 子 句 中 来 尝试 调整 查询 。 


法 则 5: ESSER) LAR 


要 确保 编写 的 谓词 与 每 个 SQL 语 句 中 都 会 连接 的 每 个 表 的 列 相 匹 配 。 不 这 样 做 会 导致 严重 的 性 能 下 降 ， 并 且 结 果 可 能 会 不 正 
确 。 


只 要 两 个 表 的 连接 不 存在 谓词 ，RDBMS 都 必须 执行 一 次 笛 卡 儿 乘 积 。 这 是 一 个 表 的 每 一 行 与 其 他 表 的 每 一 行 的 结合 。 不 匹 
配 的 行 不 会 消除 ， 因 为 它们 没有 什么 可 以 匹配 。 笛 卡 儿 乘积 的 结果 难以 解释 ， 并 且 除 了 每 个 表 的 所 有 行 的 简单 列表 ， 不 包含 任何 


言 息 。 
笛 卡 儿 乘 积 的 结果 难以 解释 。 
法 则 6: OR 的 明智 使 用 


OR 逻 辑 操作 符 对 性 能 是 件 棘 手 的 事情 。 如 果 可 以 将 使 用 DR 的 SQL 语句 转换 成 使 用 IN 的 语句 ， 性 能 也 可 能 会 提升 。 例 如 ， 考 


虑 下 面 的 SQL 语句 : 


SELECT e.position, e.last_name, e.empno, d.manager 
FROM employee œ, 

department d 
WHERE d.dept_id = e.dept_id 


AND position = 'MANAGER' 
OR position = 'DIRECTOR' 
OR position = 'VICE PRESIDENT' 


ORDER BY position; 
改 为 : 


SELECT e.position, e.last_name, e.empno, d.manager 
FROM employee e, 
department d 
WHERE d.dept_id = e.dept_id 
AND position IN ('MANAGER', 'DIRECTOR', 'VICE PRESIDENT') 
ORDER BY position; 


当然 ， 根 据 使 用 的 DBMS 和 | 数据 的 性 质 ， 结 果 可 能 会 有 所 不 同 。 
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法 则 7: LIKE 的 明智 使 用 


LIKE 逻 辑 操作 符 也 很 棘手 。 在 SQL 中 使 用 LIKE 很 容易 产生 性 能 问题 。 例 如 ， 考 虑 下 面 的 SQL: 


SELECT position, Jast_name, empno 
FROM employee 

WHERE dept_id LIKE '%X' 

ORDER BY position; 


这 个 查询 将 返回 所 有 在 dept_id 以 X 结 尾 的 任何 部 门 工作 的 雇员 的 信息 。 然 而 ， 关 系 优化 程序 将 按 顺序 扫描 数据 ， 以 便 解 决 
这 个 查询 的 问题 (无 法 使 用 索引 ) 。 由 于 不 知道 该 列 的 高 阶 部 分 ， 因 此 人 遍历 一 个 b-tree 索 引 结构 不 太 可 能 。 


你 或 许 能 够 凭借 对 数据 的 了 解 来 重 写 这 个 查询 ， 其 中 不 适用 前 导 通 配 符 (%) 。 例 如 ， 或 许 所 有 的 dept_id 的 值 都 以 A 或 B 开 
头 。 在 这 种 情况 下 ， 你 可 以 按照 下 面 的 方法 修改 SQL: 


SELECT position, last_name, empno 


FROM employee 
WHERE dept_id LIKE 'A%x' 
OR dept_id LIKE 'B%X' 


ORDER BY position; 


EXAT, WRdept_ idd 5—5], DBMS EMEA EARS H. 
再 次 说 明 ， 你 的 结果 可 能 会 随 使 用 的 DBMS 和 访问 的 数据 的 性 质 的 不 同 而 有 所 不 同 。 
LIKE 逻辑 操作 符 也 很 万 手 。 

法 则 8: 如 果 可 能 ， 避 免 排 序 


在 SQL 查询 中 对 数据 进行 排序 是 获得 最 佳 性 能 的 “抑制 剂 ”。DBM S 将 根据 需要 对 数据 进行 排序 以 满足 数据 库 的 请 求 。 使 用 
ORDER BY, GROUP BY、DISTINCT、UNION、1INTERSECT 和 EXCEPT 时 ， 请 按照 12.2.5 节 中 的 指导 来 减 小 排序 带 来 的 影响 。 


请 记 住 ， 排 序 是 个 MO 密集 型 操作 ， 可 以 〈 有 时 显著 地 ) 降低 查询 的 性 能 。 当 性 能 很 重要 时 ， 记 得 搜索 排序 并 找到 消除 它们 


的 方法 。 


法 则 9: 知道 什么 工作 最 适合 


SQL 的 灵活 性 允许 以 多 种 方式 编码 同样 的 过 程 。 然 而 ， 通 常 只 有 一 种 编码 方式 可 以 提供 较 好 的 性 能 。DBA 应 了 解 为 每 个 在 用 
的 DBM 编写 SQL 的 最 好 方式 。 此 外 ，DBA 应 向 应 用 程序 的 开发 人 员 提 供 有 关 性 能 的 适当 查询 制定 的 信息 。 


通常 只 有 一 种 编码 方式 可 以 提供 较 好 的 性 能 。 


法 则 10: 频繁 发 出 COMMIT 


编写 运行 批 处 理事 务 的 程序 时 ， 重 要 的 是 要 定期 发 出 SQL COMMIT 语 句 。 正 如 第 5 章 中 所 讨论 的 ，COMMIT 语 句 最 终 确定 
了 对 数据 库 的 修改 。 当 发 出 COMMIT 时 ， 修 改 后 的 数据 库 对 象 和 数据 上 的 锁 就 可 以 释放 了 。 


Oracle DBA 还 需要 考虑 的 是 COM MIT 对 回 滚 段 的 影响 。 在 变更 实际 写 入 表 之 前 ，Oracle 使 用 回 滚 段 存 储 完成 的 事务 。 在 
Oracle 中 发 出 COMMIT 时 ， 不 仅 表 中 的 数据 裔 定 ， 回 滚 段 的 内 容 也 删除 了 。Oracle 回 滚 段 用 来 存储 数据 “以 前 ”的 图 像 ， 以 防 
事务 回 滚 到 变更 提交 前 。 


因此 ， 作 为 DBA， 你 必须 确保 应 用 程序 开发 人 员 发 出 足够 的 COM MIT 语 句 ， 将 锁 对 可 用 性 的 影响 降 到 最 低 ， 并 将 回 滚 段 保 
持 在 一 个 可 管理 的 大 小 。 


发 出 足够 的 COMMIT 语 句 ， 将 锁 对 可 用 性 的 影响 降 到 最 低 。 


法 则 11: 谨防 代码 生成 器 


谨防 应 用 程序 代码 生成 器 以 及 可 以 自动 创建 SQL 的 类 似 工 具 。 代 码 生成 器 以 创建 性 能 低下 的 SQL 而 臭名 昭著 。 对 使 用 这 样 的 
工具 生成 的 SQL， 一 定 要 保持 密切 的 关注 ， 并 且 在 这 些 SQL 到 达 生 产 状 态 之 前 使 用 技术 提升 它们 。 


代码 生成 器 以 创建 性 能 低下 的 SQL 而 臭名 昭著 。 
许多 这 些 工 具 使 用 要 求 每 个 SQL 语句 进行 编译 以 及 每 次 请 求 都 要 进行 优化 的 网 天 。 然 而 ， 有 些 网 关 提 供 了 一 种 缓存 机 制 ， 用 
于 在 服务 器 上 存储 编译 和 优化 了 的 SQL。 这 种 高 速 缓 存 可 以 帮助 那些 经 常 重复 的 SQL 语句 提升 性 能 。 


法 则 12: 考虑 存储 过 程 


通过 使 用 存储 过 程 可 以 最 大 程度 地 减少 由 重复 的 网 络 流量 引起 的 性 能 下 降 ， 因 为 只 有 一 个 请 求 需要 执行 。 在 存储 过 程 中 ， 可 
以 发 出 多 个 SQL 语句 ， 并 将 处 理 后 的 结果 发 送 给 请 求 程序 或 用 户 。 没 有 存储 过 程 ， 这 些 SQL 语 句 (以 及 所 有 的 结果 ) 将 要 通过 网 
络 友 送 。 此 外 ， 如 果 DBMS 在 运行 时 间 之 前 将 这 些 SQL 进 行 解析 和 编译 ， 存 储 过 程 中 的 SQL 可 能 比 存储 过 程 外 部 相同 的 SQL 有 更 
好 的 表现 。 


存储 过 程 中 的 SQL 可 能 比 存储 过 程 外 部 相同 的 SQL 有 更 好 的 表现 。 


使 用 存储 过 程 的 另 一 个 潜在 的 好 处 是 可 以 提升 数据 库 的 安全 。 具 体 可 以 通过 将 特定 用 户 需要 的 业务 逻辑 封装 到 存储 过 程 的 代 
码 中 ， 然 后 允许 这 些 用 户 访问 存储 过 程 而 不 是 基础 表 实现 。 这 种 方法 可 以 减少 由 临时 和 动态 SQL (如 SQL 注入 攻击 ) 引起 的 潜在 
安全 问题 。 


12.5.2 ”其 他 SQL 调 优 技巧 

SQL 调整 是 一 项 复杂 的 任务 ， 需 要 整 本 书 来 描述 (在 本 章 的 结尾 引用 了 一 些 优秀 的 书籍 ) 。 实 际 上 ， 每 个 DBM s 都 需要 地 对 
SQL 调整 进行 长 篇 讨论 ， 来 公正 地 做 这 个 话题 。 但 是 ， 下 面 的 SQL 调整 建议 对 DBA 还 是 有 用 的 ， 无 论 什 么 DBMS: 

AERIS, RRIF HHI. 

- 只 要 可 能 ， 不 要 在 SQL 谓词 中 执行 算术 。 使 用 主机 编程 语言 (Java COBOL, CE) 执行 算术 。 

* 使 用 SQL 函数 来 减少 编程 工作 量 。 

- 寻找 方法 只 使 用 SQL 来 执行 尽 可 能 多 的 工作 。 优 化 的 SQL 通常 优 于 主机 语言 应 用 程序 代码 。 

RRR DELMAR, REBT MRE, (更 多 细节 ， 请 参阅 第 13 章 。) 


: 不 要 忘记 触发 器 的 “隐藏 的 ”影响 。 一 个 表 的 DELETE 操 作 可 能 会 触发 更 多 的 操作 。 虽 然 你 可 能 认为 这 个 问题 是 由 于 
DELETE 性 能 低下 而 造成 ， 但 也 许 触 发 器 才 是 真正 的 罪魁 祸首 。 


12.5.3 “识别 性 能 低下 的 SQL 


优化 SQL 的 任务 有 很 大 一 部 分 是 识别 有 问题 的 代码 。SQL 性 能 监控 器 是 找 出 性 能 低下 的 SQL 的 最 好 方法 。 这 样 的 工具 可 以 不 
断 地 监测 DBM SS 环境 ， 并 就 SQL 语句 消耗 的 资源 进行 报告 。 某 些 DBM SS 提供 对 SQL 监测 的 基本 捆绑 支持 ， 但 许多 第 三 方 工具 也 可 
使 用 。 这 些 工具 提供 了 更 深入 的 功能 ， 如 无 需 进行 系统 跟踪 就 可 以 识别 表现 最 差 的 SQL 的 能 力 ， 整 合 到 SQL 编码 和 调节 工具 的 能 
力 ， 以 及 图 形 化 的 性 能 图 表 和 触发 器 的 能 力 。 有 关 SQL 性 能 监控 器 和 其 他 DBA 工 具 的 更 多 信息 ， 请 参阅 第 23 章 。 


SQL 性 能 监控 器 是 找 出 性 能 低下 的 SQL 的 最 好 方法 。 


12.6 小结 


应 用 程序 性 能 管理 和 SQL 调整 是 一 个 复杂 的 领域 ， 需 要 程序 员 和 DBA 的 积极 参与 。 每 个 DBMS 的 工作 方式 都 不 相同 ，DBA 和 
程序 员 需 要 了 解 他 们 的 DBMS 的 应 用 程序 性 能 管理 和 SQL 的 所 有 微小 细节 。 


关系 优化 程序 结合 访问 路 径 策略 ， 为 每 个 SQL 请 求 形成 一 个 高 效 的 访问 路 径 。 然 而 ， 优 化 程序 是 一 种 非常 复杂 的 软件 ， 并 且 
DBMA 供 应 商 不 与 客户 分 享 他 们 的 优化 程序 是 如 何 工作 的 。 因 此 ， 很 多 时 候 ，SQL 性 能 调整 是 一 个 迭代 的 艺术 创作 过 程 ， 而 不 是 
一 门 科学 。 


12.7 [alpen 


1. 请 给 出 物理 数据 独立 性 的 定义 。 


2. 请 详细 说 明 使 用 值 的 开头 带 有 通配符 的 LIKE 操 作 会 产生 什么 影响 。 
3. 在 SQL 访问 路 径 选 择 的 过 程 中 ， 影 响 优化 程序 的 因素 有 哪些 ? 
4. 请 说 出 两 种 主要 的 天 系 连 接 方法 ， 并 详细 说 明 。 

5. 什 么 情况 下 要 执行 非 匹 配 达 引 扫描 ? 


6. 编 写 了 一 个 访问 单个 表 的 查询 。 此 外 ， 由 于 表 的 主 码 中 有 一 个 相等 运算 符 (=) ， 该 查询 将 只 返回 一 行 。 存 在 唯一 的 索引 
来 支持 主 码 。 什 么 类 型 的 访问 可 能 会 对 该 查询 最 有 效 ? 


7. 在 C/S 的 应 用 程序 中 ， 如 何 使 用 存储 过 程 来 优化 性 能 ? 
8. 什 么 情况 下 ， 表 扫描 优 于 索引 访问 ? 
9. 为 什么 在 执行 SQL 调整 和 提示 前 使 用 警告 很 重要 ? 


10. 请 详细 说 明 三 种 可 能 的 并 行 查询 访问 。 
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第 13 章 ”数据 完整 性 


确保 企业 数据 库 的 完整 性 是 DBA 工 作 的 一 个 重要 组 成 部 分 。 如 果 它 包含 的 数据 不 准确 ， 或 者 由 于 完整 性 问题 ， 它 不 能 访 
问 ， 那 么 数据 库 就 没有 多 大 用 处 。DBA 可 以 使 用 很 多 工具 来 确保 数据 的 完整 性 。 


DBA 可 以 使 用 很 多 工具 来 确保 数据 的 完整 性 。 


13.1 完整 性 的 类 型 


对 于 数据 库 ， 本 节 将 从 两 方面 讨论 其 完整 性 : 
. 数据 库 结构 的 完整 性 。 
. 语义 数据 的 完整 性 。 


跟踪 数据 库 对 象 ， 确 保 每 个 对 象 正确 创建 、 格 式 化 和 维护 是 数据 库 结构 完整 性 的 目标 。 每 个 DBMS 使 用 其 固有 的 内 部 格式 和 
结构 ， 来 支持 其 控制 的 数据 库 、 表 空间 、 表 和 索引 。 系 统 和 应 用 程序 错误 可 能 会 导致 这 些 内 部 结构 出 现 故 障 ，DBA 的 工作 是 在 
这 些 故 障 酿 成 大 祸 之 前 ， 及 时 识别 和 纠正 它们 。 

第 二 种 类 型 的 完整 性 是 语义 数据 的 完整 性 。 这 是 指数 据 的 意义 以 及 不 同类 型 数据 之 间 需 要 维护 的 关系 。DBM 提供 选项 、 控 
制 和 程序 ， 来 定义 并 确保 数据 库 中 所 存储 数据 的 语义 完整 性 。DBA 必 须 了 解 DBMS 如 何 开启 自动 语义 数据 完整 性 检查 。 而 且 ， 作 
为 工作 的 一 部 分 ，DBA 必 须 将 语义 数据 完整 性 落实 到 数据 库 设 计 中 ， 同 时 启动 过 程 来 检查 和 纠正 逐渐 蔓延 到 数据 库 中 的 完整 | 


问题 。 


13.2 ”数据 库 结 构 完整 性 


结构 化 数据 库 的 完整 性 和 一 致 性 对 数据 库 的 持续 管理 至 关 重 要 。DBMS 使 用 内 部 结构 和 指针 来 维护 数据 库 对 象 的 顺序 。 如 果 
这 些 结构 损坏 ， 那 么 将 对 数据 库 的 访问 造成 危害 。 


使 用 内 部 结构 和 指针 来 维护 数据 库 对 象 的 顺序 。 


13.2.1 “结构 性 问题 的 类 型 


关系 数据 库 会 遇 到 的 一 个 潜在 问题 ， 即 索引 损坏 。 从 前 面 的 章节 可 以 了 解 到 ， 索 引 通 过 使 用 有 序 的 b-tree 结 构 ， 为 数据 库 中 


的 数据 提供 备用 路 径 。 基 本 上 ， 索 引 的 叶 级 页 指向 基 表 中 物理 数据 的 位 置 。 如 果 指 针 没有 指向 正确 的 数据 ， 该 索引 就 没有 用 。 事 
实 上 ， 可 能 比 没有 用 更 糟糕 ， 如 果 用 它 访问 不 正确 的 数据 ， 会 引起 破坏 数据 库 的 事务 。 


如 果 指 针 没 有 指向 正确 的 数据 ， 该 索引 就 没有 用 。 


损坏 索引 的 方式 有 好 多 种 ， 取 决 于 使 用 中 的 DBMS 以 及 对 索引 和 相关 表 所 执行 的 操作 。 例 如 ， 如 果 表 恢复 到 以 前 的 时 间 点 ， 
但 索引 没有 重建 ， 索 引 将 无 法 准确 地 反映 当前 数据 的 内 容 。 


然而 ， 索 引 不 是 唯一 使 用 指针 的 数据 库 对 象 。 当 使 用 某 些 数据 类 型 时 ，DBMS 可 能 需要 指针 。 例 如 ， 非 常 大 的 对 象 ( 如 DB2 
LOB 列 和 XML 列 ) 或 SQL server 文 本 和 图 像 列 ， 没 有 与 其 余 的 数据 连续 存储。 相反 ， 分 配 这 些 数 据 类 型 的 列 存 储 在 单独 的 文件 
中 ， 该 表 的 主 文件 包含 一 个 指向 大 对 象 物理 数据 位 置 的 指针 。 如 果 这 些 指针 与 数据 不 同步 ， 也 可 能 会 导致 数据 无 法 访问 。 


另 一 种 数据 库 结 构 完整 性 问题 (虽然 比较 少见 ) 是 表 数 据 责 头 损坏 。 数 据 库 文 件 中 每 个 单独 的 物理 页 面 (或 块 ) 在 页 面 的 开 
始 存储 内 务 信息 ， 称 为 表 关 。 这 个 表 头 使 DBMS 简 单 而 快速 地 读 取 页 面 的 内 容 。 如 果 表 头 损坏 ，DBMS 可 能 无 法 解释 存储 在 页 面 
上 的 数据 。 这 种 情况 通常 需要 从 备份 文件 中 恢复 数据 库 文件 。 (对 于 备份 和 恢复 操作 的 详细 信息 ， 请 参见 第 16 章 ) 。 


备份 文件 是 结构 完整 性 问题 的 男 一 个 潜在 区 域 。 每 个 DBMS 对 其 数据 库 备份 文 件 进行 格式 化 并 维护 它 的 特定 结构 。 如 果 备份 
文件 的 格式 不 正确 ， 或 者 如 果 数 据 在 备份 文件 的 位 置 错误 ， 该 备份 文件 就 不 能 被 DBMSs 用 作 恢 复 。 介 质 故 障 、 磁 带 退 化 和 错误 可 


能 会 导致 这 样 的 问题 。 


13.2.2 ”管理 结构 性 问题 


每 个 DBMS 都 提供 了 不 同 的 实用 程序 来 检查 数据 库 结构 完整 性 的 不 同方 面 。 使 用 这 些 实用 程序 检查 数据 库 的 完整 性 是 可 能 
的 。 例 如 ，Sybase 和 Microsoft SQL Server 提 供 了 DBCC 实 用 程序 ，DB2 提 供 了 检查 和 修复 实用 程序 ，Informix 提 供 了 
TBCHECK 实 用 程序 。 


使 用 DBMS 实 用 程序 检查 数据 库 的 完整 性 。 


为 了 阐述 这 些 工具 的 功能 ， 集 中 来 看 一 下 DBCC 实 用 程序 。 图 13-1 显 示 了 一 些 可 以 使 用 DBCC 的 选项 。 结 构 完整 性 工具 的 另 
一 个 例子 是 DB2 的 修复 工具 ， 该 工具 的 简要 介绍 见 “DB2 修 复工 具 ”。 


数据 库 一 致 性 


EXTENT 


图 13-1 DBCC 实 用 程序 


运行 DBCC 工 具 时 ，DBA 要 特别 小 心 。 使 用 DBCC， 同 时 读 取 数 据 库 文 件 是 可 能 的 。 为 了 确保 数据 库 文 件 的 安全 ， 没 有 
DBMS 供 应 商 技术 支持 小 组 的 指导 ， 不 要 擅自 使 用 写 入 功能 。 


运行 DBCC 实 用 工具 时 ， 要 特别 小 心 。 


一 致 性 选项 


DBCC 实 用 程序 为 基本 一 致 性 检查 提供 了 两 个 选项 : 


* DBCC CHECKTABLE (table_name) 检查 数据 的 一 致 性 和 表 的 索引 页 。 使 用 此 选项 运行 DBCC 时 ， 它 会 报告 数据 页 数 、 行 
数 、 文 本 数 和 图 像 列 数 ， 以 及 任何 违反 完整 性 的 数量 。 


- DBCC REINDEX (table_name) 整理 建立 在 指定 表 中 的 索引 。 


DB2 修 复工 具 


修复 实用 程序 用 于 出 现 错误 或 问题 时 ， 修 改 DB2 数 据 和 相关 的 数据 结构 。 你 可 以 使 用 修复 工具 来 执行 任务 ， 例 如 ， 测 试 DBD 
定义 ， 通 过 与 系统 目录 元 数据 同步 来 修复 DBD、 复 位 未 决 状态 、 转 储 以 及 代替 具体 的 数据 表 空 间 和 索引 等 功能 


与 所 有 数据 库 结构 完整 性 相关 的 实用 程序 一 样 ， 使 用 修复 工具 应 特别 小 心 。 此 外 ， 明 智 的 做 法 是 ， 运 行 实用 程序 前 ， 先 咨询 
DBMS 支 持 中 心 (在 这 种 情况 下 ， 是 IBM) 。 如 果 使 用 不 当 ， 修 复工 具 的 某 些 选项 可 能 会 损坏 你 的 数据 库 和 存储 在 其 中 的 数据 。 


数据 库 检 查 


其 他 DBCC 选 项 用 于 检查 数据 库 的 完整 性 : 


DBCC CHECKDB (database_name) 在 数据 库 的 每 个 表 中 运行 CHECKTABLE。 这 个 选项 会 检查 所 有 定义 表 的 数据 和 索引 


页 的 一 致 性 。 


- DBCC CHECKCATALOG (database_name) 检查 指定 数据 库 的 系统 目录 表 的 一 致 性 。 它 将 报告 使 用 的 段 的 大 小 和 数量 ， 以 
及 检测 和 报告 任何 完整 性 错误 。 


DBCC CHECKALLOC (database_name) 检查 指定 的 数据 库 和 报告 当前 程度 结构 的 一 致 性 。 如 果 在 事务 修改 数据 库 时 运行 
DBCC，CHECKALLOC 选 项 可 能 会 发 现 虚 假 的 分 配 问 题 。 此 选项 也 报告 分 配 的 数量 和 每 个 分 配 使 用 的 页 面 的 数量 。 


- DBCC CHECKFILEGROUP (filegroup_name) 检查 所 有 表 和 指定 数据 库 的 索引 视图 的 分 配 和 结构 完整 性 ， 并 发 出 结果 报 


告 。 


内 存 使 用 


DBCC 命 令 可 以 用 来 监视 当前 的 内 存 分 配 和 使 用 。 如 果 指 定 MEMUSAGE 关 键 字 (例如 ，DBCC MEMUSAGE) ， 实 用 程序 
将 报告 配置 的 内 存 分 配 和 前 20 位 内 存 用 户 的 内 存 使 用 量 。 显 示 以 下 信息 : 


DBCC 命 令 可 以 用 来 监视 当前 的 内 存 分 配 和 使 用 。 

. 配置 的 内 存 : DBMS 配 置 的 内 存量 。 

“ 代码 大 小 : 使 用 的 代码 的 内 存量 。 

- 内 核 和 结构 : 内 核 和 服务 器 使 用 的 内 存量 。 

“RHA: 用 于 数据 缓存 的 内 存量 。 

. 程序 缓冲 和 表 头 : 用 于 程序 缓存 的 内 存量 。 

“ 缓冲 区 高 速 缓存 细节 : 前 20 位 用 户 数 据 缓存 的 清单 ， 表 明正 在 访问 的 数据 库 和 对 象 ， 以 及 有 多 少 个 2KB 缓 冲 区 正在 使 用 。 


* 程序 高 速 缓 存 细节 : 前 20 名 用 户 程序 高 速 缓存 的 清单 ， 表 明 使 用 类 型 和 内 存 利用 率 。 
其 他 选项 


还 有 各 种 其 他 的 DBCC 选 项 可 供 选择 ， 包 括 能 够 生成 包含 数据 库 内 部 信息 的 报告 (例如 ， 创 建 日 期 和 内 部 标识 符 ) ， 打 印 显 
示 标 题 内 容 的 格式 表 页 ， 转 储 和 显示 缓冲 区 和 高 速 缓存 的 内 容 ， 以 及 “zap” 数 据 库 ( 即 对 任何 数据 库 内 容 作出 快速 更 改 ) 。 没 
有 制造 商 的 指导 ，“zap” 数 据 库 不 是 一 个 好 主意 。 


13.3 ”语义 数据 的 元 整 性 
语义 数据 的 完整 性 论述 了 可 用 于 确保 数据 库 中 数据 内 容 的 准确 性 和 可 行 性 的 DBMS 功 能 和 过 程 。 而 结构 数据 库 的 完整 性 是 指 
数据 (数据 库 对 象 ) “ 持 有 人 ”的 一 致 性 ， 语 义 数据 的 完整 性 是 指数 据 本 身 的 一 致 性 . 


DBA 不 断 纠 结 于 如 何 最 好 地 实施 数据 完整 性 的 问题 ， 是 使 用 DBMS 的 功能 还 是 使 用 应 用 程序 代码 。 这 是 一 个 经 常 辩 论 的 重要 
问题 。 一 般 情 况 下 ， 用 DBMS 功 能 支持 数据 的 完整 性 通常 可 以 提供 更 好 的 解决 方案 。 


使 用 DBMS 的 功能 ， 而 不 是 通过 阅读 程序 代码 比较 容易 发 现 和 保持 语义 完整 性 规则 。 如 果 你 喜欢 阅读 代码 ， 请 记 住 在 异 构 环 
境 中 ， 你 可 能 往往 需要 读 取 几 种 语言 (COBOL、Java 和 Visual Basic) 。 此 外 ， 你 需要 知道 如 何 从 来 自 新 增强 代码 的 旧 代 码 中 
找 出 活动 代码 。 


使 用 DBMS 的 功能 ,许多 形式 的 语义 数据 的 完整 性 可 以 强制 执行 。 请 参阅 “SQL Server 2012 语 义 完整 性 ”， 快速 了 解 SQL 
Server 在 这 一 领域 的 支持 。 当 DBMS 设 施用 于 实施 数据 完整 性 时 ， 需 要 编写 的 代码 更 少 ， 因 此 需要 测试 的 代码 就 更 少 。“ 产 
品 ” 出 货 的 时 间 和 成 本 都 会 减少 。 


使 用 DBMS 的 功能 ， 许 多 形式 的 语义 数据 的 完整 性 可 以 强制 执行 。 
SQL Server 2012 语 义 完整 性 


Microsoft SQL Server 2012 包 含 几 种 管理 语义 完整 性 和 数据 质量 的 功能 。 也 许 最 有 趣 的 特征 是 数据 质量 服务 (DQS) ， 这 有 利 
于 数据 专业 人 员 保 持 数 据 的 质量 ， 确 保 数 据 适 合 业 务 目 的 。DQS 是 一 个 知识 驱动 性 的 解决 方案 ， 同 时 提供 电脑 辅助 和 互动 方式 管 
理 SQL Server 数 据 的 完整 性 和 质量 。DQS 可 以 让 你 发 现 、 构 建 和 管理 数据 的 知识 。 然 后 ， 你 可 以 使 用 这 些 知 识 来 进行 数据 清理 、 
匹配 和 分 析 。 你 还 可 以 利用 DQS 数 据 质量 项 目 中 基于 云 服务 的 引用 数据 提供 商 。 


DQS 提 供 以 下 功能 来 解决 数据 质量 问题 : 
数据 清理 ; 
- 数据 匹配 ; 


. 参考 数据 服务 ; 


“ 知识 库 。 


SQL Server 还 为 主 数据 服务 提供 了 主 数据 管理 。 使 用 Microsoft SQL Server 主 数据 服务 ， 数 据 业 务 可 以 保证 不 同 应 用 程序 中 数 
据 的 一 致 性 和 信息 的 完整 性 。 主 数据 服务 软件 可 以 用 规则 和 自动 化 的 工作 流程 来 确保 主 数据 中 心 的 质量 。 


在 调查 第 三 方 软件 的 语义 数据 完整 性 的 解决 方案 前 ， 确 保 彻 查 内 部 DBMS 产 品 的 功能 和 功能 集 。 其 中 许多 都 可 以 用 来 提高 数 
据 库 数据 的 质量 和 完整 性 。 


13.3.1 实体 完整 性 

实体 完整 性 是 关系 数据 库 所 提供 的 最 基本 层面 上 的 数据 完整 性 。 实 休 完 半 性 意味 着 每 一 个 实体 实例 必须 是 唯一 可 识别 的 。 换 
名 话说， 实体 完整 性 要 求 为 每 个 实体 指定 一 个 主 码 ， 主 码 不 能 为 空 

实体 完整 性 意味 着 每 一 个 实体 实例 必须 是 唯一 可 识别 的 。 


实践 中 ， 主 RDBMSs 产 品 不 会 强制 实体 完整 性 ， 因 为 不 需要 指定 主 码 就 可 创建 实体 或 表 。 然 而 ， 创 建 表 但 没有 主 码 ， 不 是 一 
种 好 的 做 法 ， 因 为 这 使 识别 表 的 行 变 得 很 困难 。 


设置 表 之 间 的 参照 完整 性 (RI) ， 主 码 是 必需 的 。 主 码 约束 可 以 包括 来 自 同一 个 表 、 表 内 唯一 的 一 列 或 多 列 。 一 个 表 只 能 
一 个 主 码 约束 ， 不 能 含有 空 值 。 


DBMS 要 求 在 主 码 约束 的 列 上 创建 唯一 索引 来 禁止 重复 的 列 值 。 某 些 DBMS (如 Sybase) 主 码 约束 创建 时 会 自动 生成 唯一 
的 索引 。 


以 下 是 一 个 主 码 约束 的 例子 : 


CREATE TABLE EMP 


(empno INTEGER PRIMARY KEY, 
emp_address VARCHAR(70), 

emp_type CHAR(8), 

emp_dept CHAR (3) NOT NULL WITH DEFAULT, 
salary DECIMAL(7,2) NOT NULL, 

commission DECIMAL(7,2), 

bonus DECIMAL (7,2) 

) IN db.ts; 


这 个 例子 显示 在 列 级 指定 主 码 约束 : 它 适 用 于 empno 列 ， 该 列 定义 为 表 的 主 码 。 然 而 ， 实 践 中 主 码 由 多 个 列 组 成 是 很 常见 
的 。 出 于 这 个 原因 ， 约 束 也 可 以 定义 在 表 级 别 。 例 如 ， 如 果 这 个 表 的 主 码 定义 为 empno 列 和 emp_type 列 的 组 合 ， 你 可 以 在 表 后 
面 添 加 以 下 说 明 ， 紧 跟 定义 的 最 后 一 列 : 


PRIMARY KEY pkemp 
(empno, emp_type) 


当然 ， 在 此 之 前 ， 主 码 说 明 将 不 得 不 从 empno 删 除 ， 因 为 每 个 表 不 能 指定 一 个 以 上 的 主 码 。 此 外 ， 请 注意 ， 在 这 个 例子 中 
主 码 约束 的 名 字 为 pkemp。 


13.3.2 ”唯一 约束 

唯一 约束 类 似 于 主 码 约束 。 每 个 表 可 以 有 零 个 、 一 个 或 多 个 唯一 约束 ， 每 个 唯一 约束 有 一 列 或 多 列 。 存 储 在 列 或 列 组 合 中 的 
值 ， 在 该 表 中 必须 是 唯一 的 ， 即 其 他 行 不 能 包含 相同 的 值 。 

唯一 约束 不 同 于 主 码 约束 ， 它 们 不 能 用 于 支持 引用 约束 。 此 外 ， 唯 一 约束 的 列 可 以 设置 为 空 。 

唯一 约束 ， 不 能 用 于 支持 引用 约束 。 


在 有 主 码 约束 的 情况 下 ，DBMS 需 要 在 唯一 约束 的 列 上 创建 唯一 索引 来 禁止 重复 的 列 值 。DBA 应 该 创建 唯一 约束 的 列 或 列 的 
组 合 ， 它 们 在 表 内 必须 是 唯一 的 。 唯 一 约束 比试 图 强制 唯一 性 的 编程 更 有 效 。 


13.3.3 ”数据 类 型 


数据 类 型 和 数据 长 度 是 应 用 到 数据库 中 的 数据 的 最 根本 的 完整 性 约束 。 创 建 表 时 ， 只 要 指定 每 一 列 的 数据 类 型 ，DBMS 就 会 
自动 确保 只 有 正确 类 型 的 数据 才 可 以 存储 在 该 列 。 避 免 将 数据 插入 或 更 新 为 错误 的 类 型 。 此 外 ， 可 以 设置 列 的 最 大 长 度 ， 从 而 禁 
止 大 于 此 长 度 的 值 存储 在 表 中 。 


DBA 必 须 明 智 地 选择 每 一 列 的 数据 类 型 和 长 度 。 选 择 与 该 列 中 正确 值 的 域 最 匹配 的 数据 类 型 。 例 如 ， 数 值 列 应 该 定义 为 下 
列 数值 数据 类 型 之 一 : 整数 、 小 数 或 浮 点 数字 列 。 


DBA 必 须 明智 地 选择 每 一 列 的 数据 类 型 和 长 度 。 

为 列 指定 包含 数值 数据 的 字符 数据 类 型 ， 将 为 编辑 检查 数值 的 应 用 程序 增加 额外 的 工作 。 该 程序 编辑 检查 数据 可 能 比 DBMS 
的 效率 低 。 此 外 ， 应 用 程序 的 范围 外 的 数据 插入 或 数据 修改 根本 无 法 检查 编辑 ， 因 为 可 能 给 数据 库 带 来 数据 完整 性 问题 。 
用 户 自 定 义 数 据 类 型 


用 户 自 定义 数据 类 型 (或 简称 UDT) 为 扩展 数据 (可 以 存储 在 数据 库 中 ) 的 类 型 和 数据 处 理 方式 提供 了 一 种 机 制 。 换 句 话 
说 ，DBA 可 以 创建 用 户 自 定 义 数 据 类 型 ， 进 一 步 前 明基 列 的 合法 值 。 一 旦 UDT 定 义 和 实 施 ， 通 过 DBA 在 CREATE TABLE DDOE 
句 中 指定 UDT ( 像 指 定 内 置 数据 类 型 一 样 ) ， 就 可 以 对 DBMS 的 功能 进行 扩展 。 


用 户 自 定义 数据 类 型 对 可 以 存储 在 数据 库 中 的 数据 类 型 进行 扩展 。 


如 果 需 要 存储 的 数据 是 专门 为 企业 定制 的 ， 使 用 UDT 会 很 有 好 处 。 例 如 ，UDT 对 于 必须 处 理 多 种 货币 的 企业 有 用 。 每 种 货 
币 有 一 个 单独 的 数据 类 型 时 ， 货 币 计算 才 不 可 能 出 错 。 假 设 你 的 公司 需要 处 理 来 自 加 拿 大 、 美 国 、 欧 盟 和 日 本 的 货币 金额 。 
DBA 可 以 创建 四 个 UDT， 如 

CREATE DISTINCT TYPE canadian_dollar AS DECIMAL(11,2); 

CREATE DISTINCT TYPE US_dollar AS DECIMAL(11,2); 


CREATE DISTINCT TYPE euro AS DECIMAL(11,2); 
CREATE DISTINCT TYPE japanese_yen AS DECIMAL(15,2); 


用 户 自 定义 数据 类 型 创建 之 后 ， 就 可 以 像 系 统 定义 的 数据 类 型 一 样 使 用 了 。 当 然 ， 创 建 和 使 用 UDT 的 实际 语法 根据 DBMS 会 
有 所 不 同 。Sybase 和 Microsoft SQL Server 使 用 系统 存储 的 程序 创建 UDT， 而 Oracle 和 DB2 使 用 CREATE 语 句 ， 如 前 面 例子 中 所 
提 到 的 。 


创建 独立 的 数据 类 型 时 ，DBM S 会 强制 强 类 型 。 换 句 话说 ，DBM S 会 禁止 不 同类 型 所 有 未 定义 的 操作 。 例 如 ， 对 于 强 类 型 ， 
下 面 的 操作 就 是 不 允许 的 : 


TOTAL_AMT = US_DOLLAR + CANADIAN_DOLLAR 


如 果 此 操作 人 允许 进行 ，TOTAL_ AMT 计 算 将 变 得 无 用 ， 因 为 如 果 不 将 不 同 的 货币 转换 成 通用 的 货币 你 就 无 法 对 它们 进行 操 
作 。 所 以 ，UDT 和 强 类 型 可 以 帮助 避免 数据 完整 性 问题 。 


创建 用 户 自 定义 的 数据 类 型 的 男 一 个 好 处 是 整个 数据 库 额 外 的 一 臻 性。 例如， 如果 建立 一 个 社会 安全 号 码 UDT， 包 含 社会 
安全 号 码 的 每 一 列 都 使 用 UDT， 那 么 就 可 以 确保 每 一 个 社会 安全 号 码 以 相同 的 方式 进行 存储 。 


此 外 ，UDT 对 数据 库 设计 提供 了 更 高 层次 的 抽象 。 讨 论 薪 酬 数据 类 型 (其 隐 合 的 定义 、 性 质 和 约束 ) ， 比 讨论 
DECIMAL (11, 2) 或 SMALLMONEY 数 据 类 型 (除了 固有 的 类 型 ,没有 其 他 隐 合 的 特性 ) 更 容易 。 


13.3.4 ANMA 


创建 列 时 ， 可 以 为 它们 分 配 一 个 默认 值 ， 在 发 出 SQL INSERT 语 句 但 没有 为 该 列 提 供 一 个 明确 的 值 时 使 用 。 这 允许 程序 员 忽 


略 列 和 DBMS， 而 自动 提供 一 个 默认 值 。 


每 一 列 只 能 有 一 个 默认 值 。 列 的 数据 类 型 、 长 度 和 属性 必须 能 够 支持 指定 的 默认 值 。 例 如 ， 数 字 列 不 能 分 配 一 个 字符 默认 
值 。 此 外 ， 默 认 值 可 能 为 空 ， 但 只 有 当 列 创建 成 一 个 可 为 空 的 列 时 才 如 此 。 


每 一 列 只 能 有 一 个 默认 值 。 


13.3.5 ”检查 约束 


检查 约束 是 一 种 DBMS 定 义 的 限制 ， 用 于 限制 存储 在 表 的 一 列 或 多 列 的 数据 值 。 定 义 检 查 约束 时 ， 它 会 通过 布尔 表达 式 说 明 
对 某 列 的 内 容 设置 特定 的 数据 值 限 制 。 在 表 的 DDL 中 对 表达 式 进行 明确 的 定义 ， 并 使 用 与 制定 SQL WHERE 子 句 大 致 相同 的 方式 
制定 。 任 何 企图 修改 列 数据 ( 即 在 INSERT 和 UPDATE 处 理 过 程 中 ) 都 会 导致 表达 式 评 估 。 如 果 修改 符合 布尔 表达 式 ， 修 改 允许 
进行 ; 如 果 不 是 ， 该 语句 将 因 违 反 约 束 而 失败 。 


检查 约束 是 一 种 DBMS 定 义 的 限制 ， 用 于 限制 存储 在 表 的 一 列 或 多 列 的 数据 值 。 


可 以 在 创建 表 时 定义 检查 约束 ， 或 者 修改 表 之 后 添加 。 如 果 你 懂 SQL， 很 容易 学 习 如 何 编写 检查 约束 ， 因 为 它们 的 语法 可 以 
识别 SQL。 检 查 约束 的 语法 由 两 部 分 组 成 : 一 个 约束 名 称 和 一 个 检查 条 件 。 


约束 名 称 标识 数据 库 的 检查 约束 。 同 一 个 表 只 能 指定 一 次 相同 的 约束 名 称 。 如 果 没有 对 约束 名 称 进行 明确 的 编码 ，DBMS 会 
自动 生成 一 个 唯一 的 约束 名 称 。 每 个 DBMS 使 用 不 同 的 算法 生成 约束 名 称 ， 但 名 称 通常 来 自 检查 条 件 中 第 一 列 的 名 称 。 


检查 条 件 定义 实际 的 约束 多 辑 。 检 查 条 件 ， 可 以 使 用 任何 基本 谓词 (>.<. =, <>, <=, >=) , DURBETWEEN, IN, 
LIKE 和 NULL 来 定义 。 此 外 ，“ 和 ”与 “或 ”可 用 于 将 检查 约束 的 条 件 串 在 一 起 。 


但 是 ,创建 检查 约束 有 一 些 限制 |: 
* 检查 约束 仅 指 创建 它 的 表 中 的 列 。 


"SQL 结构 的 有 限 子 集 在 检查 约束 定义 范围 内 是 允许 的 。 通 常情 况 下 ，SQL 结 构 如 子 查询 、 列 功能 、 主 机 变量 、 否 定 (如 
NOT) 和 特殊 寄存 器 在 检查 约束 内 是 禁止 的 。 


. 检查 约束 的 第 一 个 操作 数 是 表 中 列 的 名 称 ， 第 二 个 操作 数 是 列 名 ， 或 者 是 个 常数 。 

` 如 果 第 二 个 操作 数 是 一 个 常数 ， 它 必须 能 与 第 一 个 操作 数 的 数据 类 型 兼容 ; 如 果 第 二 个 操作 数 是 一 个 列 ， 它 必须 与 指定 的 
第 一 列 的 数据 类 型 相同 。 
爹 查 约束 的 好 处 


那么 ， 检 查 约 束 有 哪些 好 处 ”主要 的 好 处 在 于 其 能 够 将 业务 规则 直接 强制 到 数据 库 中 ， 无 需 额 外 的 应 用 程序 逻辑 。 一 旦 定 
就 需要 物理 实现 业务 规则 ， 不 能 绕 开 。 


xK 


因为 不 需要 进行 额外 的 编程 ，DBA 可 以 实施 检查 约束 而 不 需要 应 用 程序 编程 人 员 的 介入 。 这 有 效 地 减少 了 编程 人 员 必 须要 
编写 的 代码 的 数量 。 大 多 数 企 业 积压 了 大 量 重要 的 应 用 程序 ， 这 可 能 是 部 署 检查 约束 最 天 键 的 原因 。 


侈 查 约束 提供 了 更 好 的 数据 完整 性 。 因 为 经 常 在 修改 数据 (定义 检查 约束 的 列 的 数据 ) 的 同时 执行 检查 约束 ， 在 临时 处 理 和 


动态 SQL 时 不 能 绕 开 业务 规则 。 当 强制 执行 业务 规则 被 应 用 程序 编程 逻辑 代 蔡 时 ， 规 则 就 不 能 在 临时 处 理 期 间 检查 。 
检查 约束 提供 了 更 好 的 数据 完整 性 。 


检查 约束 促进 了 一 致 性 。 因 为 约束 强制 执行 时 才 实施 一 次 (在 表 DDL) 。 另 一 方面 ， 写 入 应 用 程序 逻辑 中 的 约束 ， 必 须 由 修 
改 那些 约束 适用 的 数据 的 程序 执行 。 这 可 能 会 导致 代码 重复 和 维护 不 一 致 ， 进 而 导致 不 准确 的 业务 规则 支持 。 


通常 情况 下 ，DDL 中 编写 的 检查 约束 比 执行 相同 编辑 检查 的 应 用 程序 代码 更 好 。 检 查 约束 的 总 体 影 响 是 在 提高 应 用 程序 开发 
生产 力 的 同时 ， 提 高 数据 的 完整 性 。 


检查 约束 的 例子 


检查 约束 使 DBA 或 数据 库 设计 者 能 够 直接 为 数据 库 指定 更 加 强大 的 数据 完整 性 规则 。 请 看 下 面 的 例子 : 


CREATE TABLE EMP 
Cempno INTEGER PRIMARY KEY, 
CONSTRAINT check_empno 
CHECK (empno BETWEEN 100 and 25000), 
emp_address VARCHAR(70), 


emp_type CHAR(8) 

CHECK (emp_type IN ('temp', '‘fulltime', 'contract')), 
emp_dept CHAR (3) NOT NULL WITH DEFAULT, 
salary DECIMAL(7,2) NOT NULL 


CONSTRAINT check_salary 
CHECK (salary < 50000.00), 
commission DECIMAL(7,2), 
bonus DECIMAL (7, 2) 
) IN db.ts; 


EMP 表 的 CREATE 语 句 包 含 三 个 不 同 的 检查 约束 : 
第 一 个 检查 约束 的 名 称 是 check_empno。 定 义 在 empno 列 。 约 束 确 保 cempno 列 包含 从 100~25000 的 值 (而 不 是 有 效 整 数 ) 。 


: 此 表 的 第 二 个 检查 约束 在 emp_type 列 。 这 是 一 个 未 命名 约束 的 例子 ， 尽 管 可 能 ， 但 不 推荐 。 最 好 始终 提供 一 个 明确 的 约束 
名 称 方便 识别 和 管理 。 这 个 特定 的 约束 将 可 以 放 到 emp_type 的 值 限制 为 sa 、““fulltime” 和 “contract”， 其 他 任何 值 都 不 


会 接受 。 
. 该 表 的 最 后 一 个 检查 约束 名 为 check_salary。 它 有 效 地 确保 了 没有 员工 可 以 年 薪 超 过 5 万 美元 〈 谁 愿意 在 那里 工作 ? ) 。 


第 一 个 检查 约束 的 例子 描述 了 列 级 约束 。 但 是 ， 检 查 约束 也 可 以 在 表 级 别 编写 。 列 级 检查 约束 在 紧 跟 该 列 的 DDL 中 定义 。 同 
样 ， 表 级 检查 约束 在 该 表 所 有 列 的 后 面 定 义 。 


通常 业务 数据 的 完整 性 规则 需要 访问 一 个 表 的 多 列 。 当 这 种 情况 发 生 时 ， 明 智 的 做 法 是 将 业务 规则 编写 到 表 级 检查 约束 中 ， 
而 不 是 列 级 。 当 然 ， 任 何 列 级 检查 约束 也 可 以 定义 在 表 级 。 在 功能 方面 ， 定 义 在 表 级 的 完整 性 约束 和 定义 在 列 级 的 相同 约束 之 间 
没有 任何 区 别 。 下 面 添 加 几 个 表 级 检查 约束 来 增强 示例 表 DDL: 

CREATE TABLE EMP 


(empno INTEGER PRIMARY KEY, 
CONSTRAINT check_empno 


CHECK (empno BETWEEN 100 AND 25000), 
emp_address VARCHAR(70), 


emp_type ~  CHAR(8) 

CHECK (emp_type IN ('temp', ‘fulltime’, 'contract')), 
emp_dept CHAR (3) NOT NULL WITH DEFAULT, 
salary DECIMAL(7,2) NOT NULL 


CONSTRAINT check_salary 
CHECK (salary < 50000.00), 
commission DECIMAL(7,2), 
bonus DECIMAL (7, 2) 
CONSTRAINT comm_vs_salary 
CHECK (salary > commission), 
CONSTRAINT comm_bonus 
CHECK (commission=0 OR bonus=0), 
) IN db.ts; 


现在 EMP 表 的 CREATE 语 句 已 修改 为 两 个 具有 以 下 分 支 的 表 级 检查 约束 : 
- EMP 表 中 第 一 个 表 级 检查 约束 名 为 comm_vs_salary。 此 约束 确保 没有 员工 可 以 赚 取 比 薪 水 更 多 的 佣金 。 


: 第 二 个 表 级 检查 约束 名 为 comm_bonus。 此 约束 将 确保 员工 不 能 同时 享有 佣金 和 奖金 。 


为 空 和 其 他 潜在 的 问题 


检查 约束 的 另外 一 个 考虑 是 关系 空 值 。 定 义 检查 约束 的 任何 可 为 空 列 都 可 以 设 为 空 值 。 列 设 为 空 时 ， 检 查 约束 的 计算 结果 未 
知 。 因 为 空 值 表示 缺少 值 ， 存 在 空 值 不 会 违反 检查 约束 。 


定义 检查 约束 的 任何 可 为 空 列 都 可 以 设 为 空 值 。 


运行 数据 库 实 用 程序 可 能 会 导致 检查 约束 问题 。 例 如 ， 根 据 DBMS， 当 数据 加 载 到 表 中 时 ，LOAD 实 用 程序 可 能 会 或 可 能 不 
会 强制 检查 约束 。 如 果 不 强制 约束 ， 数 据 加 载 可 以 不 符合 表 中 定义 的 检查 约束 ， 从 而 造成 数据 完整 性 问题 。 如 果 在 加 载 过 程 中 强 
制约 束 ， 有 人 将 不 得 不 手动 编辑 未 加 载 的 行 ， 这 样 就 可 以 遵守 表 的 检查 约束 定义 。 


检查 约束 的 另 一 个 潜在 问题 是 表 与 表 的 编码 不 一 致 。 很 可 能 具有 相同 数据 类 型 和 长 度 的 列 将 出 现在 数据 库 的 多 个 表 中 。 如 果 
所 有 这 些 列 必须 遵守 相同 的 编辑 检查 要 求 ，DBA 必 须 跨 表 为 每 个 列 创建 相同 的 检查 约束 ， 这 么 做 很 可 能 会 出 错 。 请 参阅 “ 规 
QW’ ， 讨 论 了 Sybase 和 Microsoft SQL Server 中 有 助 于 缓解 这 一 问题 的 不 同类 型 的 约束 。 


规则 
Sybase 和 Microsoft SQL Server 提 供 了 一 个 特别 的 检查 约束 类 型 ， 称 为 规则 。 虽 然 规则 与 检查 约束 类 似 ， 它 们 却 是 “独立 


的 ”数据 库 对 象 。 


正如 检查 约束 ， 规 则 定义 用 于 数据 验证 的 参数 。 每 当 插 入 或 更 新 数据 时 ， 都 要 检查 规则 ， 确 保 数据 修改 符合 规则 。 列 和 
UDT 都 可 以 有 自己 的 规则 。 


规则 创建 后 ， 它 必须 与 列 和 UDT 进 行 绑 定 ， 才 会 对 数据 库 产 生 影响 。 绑 定 通过 使 用 SP_BINDRULE 系 统 程序 完成 。 例 如 ， 下 
面 的 语句 可 用 于 创建 一 个 规则 ， 强 制 state 区 号 仅 代 表 Illinois、Wisconsin 或 Indiana， 然 后 将 规则 绑 定 到 两 个 不 同 表 的 state 列 : 
CREATE rule state_rule AS @state IN (“IL”, “WI”, “IN”) 


EXEC sp_bindrule “state_rule”, “publishers.state” 
EXEC sp_bindrule “state_rule”, “authors.state” 


一 旦 规则 绑 定 到 列 或 用 户 自 定义 的 数据 类 型 ， 它 的 功能 就 与 检查 约束 一 样 。 每 当 插 入 或 更 新 数据 值 时 ， 都 会 调用 该 规则 ， 以 
确保 值 符合 规则 定义 。 不 再 需要 规则 时 ， 使 用 系统 的 SP_UNBIND 程 序 ， 可 以 将 规则 从 列 或 用 户 自 定义 的 数据 类 型 中 删除 。 


规则 可 能 比 检查 约束 更 可 靠 ， 因 为 规则 绑 定 到 相应 的 列 和 数据 类 型 后 只 需要 创建 一 次 。 所 以 ， 如 果 约 束 应 用 于 多 个 列 ， 规 则 
比 检查 约束 需要 的 工作 量 更 少 。 必 须要 在 需要 检查 的 每 个 表 的 DDL 中 对 检查 约束 进行 明确 的 编码 。 


Microsoft 已 经 表示 在 未 来 版 本 的 Microsoft SQL Server 中 ， 将 删除 规则 。 出 于 这 个 原因 ， 避 免 创建 任何 新 规则 而 专注 于 使 
用 约束 可 能 是 一 个 好 主意 。 但 Sybase 没 有 表示 将 删除 规则 。 此 外 ， 可 以 在 表 上 定义 不 可 行 检查 约束 。 关 系 DBMS 产 品 提供 了 其 
他 功能 来 指定 列 的 默认 值 。 如 果 向 表 中 插入 新 行 或 加 载 新 行 却 没有 为 某 列 指定 值 ， 该 列 就 会 设 为 在 列 默认 说 明 中 已 经 识别 的 值 。 
例如 ，DBA 可 以 为 示例 EMP 表 的 emp_type 列 定义 一 个 默认 值 : 


emp_type CHAR(8) DEFAULT 'fulltime' 
CHECK (emp_type IN ('temp', ‘fulltime’, ‘contract')), . 


如 果 插 入 的 行 没有 指定 emp_type， 该 列 将 默认 为 “fulltime”。 然 而 ， 大 多 数 DBMs 的 设计 并 不 执行 语义 检查 约束 和 默认 
值 。 例 如 ，DBMS 人 允许 DBA 定 义 与 检查 约束 相 矛 盾 的 默认 值 。 此 外 ，DBA 可 能 定义 彼此 矛盾 的 检查 约束 。 这 类 问题 必须 尽量 避 
免 。 矛 盾 约 束 的 例子 如 下 。 


在 下 列 情况 下 ， 没 有 值 既 大 于 10 又 小 于 9， 所 以 没有 值 可 以 插入 表 中 。 
CHECK (empno > 10 AND empno <9) 
在 下 列 情况 下 ， 根 据 定义 的 约束 ， 默 认 值 不 是 emp_type 列 允许 的 值 。 默 认 值 不 会 插入 ， 因 此 ， 揪 入 行 时 必须 提供 值 。 


emp_type CHAR(8) DEFAULT 'new' 
CHECK (emp_type IN ('temp', ‘fulltime’, 'contract')), . 


在 最 后 一 种 情况 下 ， 约 束 是 多 余 的 。 虽 然 没有 造成 逻辑 伤害 ， 却 对 两 个 约束 都 进行 了 检查 ， 因 此 对 应 用 程序 的 性 能 产生 了 影 
响 ， 该 应 用 程序 用 于 修改 约束 所 在 的 表 。 


CHECK (empno > 10) 
CHECK (empno >= 11) 


当然 ， 也 可 能 出 现 其 他 潜在 的 语义 问题 ， 如 

- 当 父 表 指 定 一 个 中 和 DELETE RI 约束 ， 而 子 表 却 定义 了 检查 约束 说 明 CHECK (COLI IS NOT NULL) 时 。 
当 两 个 约束 定义 在 同一 列 上 ， 条 件 互相 矛盾 时 。 

当 约 束 要 求 该 列 为 空 ， 而 该 列 定 义 为 非 空 时 。 


检查 约束 提供 了 非常 强大 的 工具 支持 在 数据 库 中 的 业务 规则 。 它 们 不 能 绕 过 ， 因 此 可 以 提供 比 相应 的 逻辑 应 用 程序 编程 更 好 
的 数据 完整 性 。DBA 明 智 的 做 法 是 在 数据 库 中 定义 检查 约束 ， 而 不 是 在 应 用 程序 中 编写 类 似 的 编辑 检查 逻辑 。 


13.3.6 触 友 器 


触发 器 是 受 事 件 驱动 的 、 附 加 到 数据 库 表 的 专门 程序 。 触 发 器 是 一 段 响应 数据 修改 语句 的 代码 ， 即 INSERT、UPDATE 或 
DELETE。 更 确切 地 说 ， 触 发 器 是 受 事件 驱动 的 专门 程序 ， 人 存储 于 DBMS， 由 DBMS 管 理 。 每 个 触发 器 都 附加 到 一 个 特别 指定 的 
表 。 触 发 器 可 以 认为 是 规则 或 约束 的 高 级 形式 ， 使 用 扩展 SQL 编写 而 成 。 触 发 器 不 能 直接 调用 或 执行 ， 由 RDBMS 在 某 种 情况 下 

(如 关联 表 的 数据 修改 ) 自动 执行 (或 触发 ) 。 


触发 器 是 一 段 响 应 数据 修改 语句 的 代码 。 


一 旦 创建 了 触发 器 ， 它 总 是 在 “ 触 友 ” 事 件 (UPDATE、INSERT 或 DELETE) 发 生 时 执行 。 因 此 ， 触 发 器 是 自动 的 、 隐 式 的 
和 不 可 避免 的 。 定 义 触 友 器 的 数据 库 有 时 也 称 作 活 动 的 数据 库 ， 因 为 简单 的 数据 修改 就 会 导致 额外 的 事情 (触发 器 代码 中 定义 
AY) 发 生 。 


触发 器 类 似 于 存储 过 程 。 两 者 都 包括 存储 在 数据 库 由 数据 库 进 行 管理 的 程序 逻辑 。 然 而 ， 存 储 过 程 不 受 事件 驱动 ， 也 没有 附 
加 到 一 个 特定 的 表 。 人 存储 过 程 通过 程序 调用 显 式 执行 (触发 器 是 隐 式 执行 的 ) 。 另 外 ， 人 存储 过 程 可 以 访问 许多 表 ， 且 并 不 需要 与 
它们 有 任何 关联 。 


触发 器 对 实施 某 些 代码 非常 有 帮助 ， 这 些 代码 由 于 某 个 预定 义 事件 ， 而 必须 定期 执行 。 使 用 触发 器 ， 可 以 消除 调度 和 数据 完 
整 性 问题 ， 因 为 触发 事件 发 生 时 触发 器 将 触发 。 不 必 记 得 调度 或 编写 在 触发 器 执行 的 逻辑 ， 因 为 都 是 自动 进行 的 。 


触发 器 可 以 实现 许多 实际 的 用 途 。 很 多 时 候 ， 只 使 用 DDL 不 可 能 将 业务 规则 编码 到 数据 库 中 。 例 如 ， 大 多 数 DBM SS 不 支持 复 
杂 的 约束 (只 有 基于 值 的 CHECK 约 束 ) 或 某 些 类 型 的 引用 约束 (如 吊 验 DELETE 处 理 或 级 联 UPDATE) 。 使 用 触发 器 ， 为 在 
DBMS 中 实现 业务 规则 和 约束 建立 了 一 个 非常 灵活 的 环境 。 这 很 重要 ， 因 为 数据 库 中 的 业务 规则 可 以 确保 每 个 人 都 使 用 相同 的 逻 
辑 来 完成 相同 的 过 程 。 


触发 器 相当 灵活 ， 还 可 以 对 它 进 行 编码 来 满足 各 种 用 途 。 例 如 ， 触 发 器 可 以 
+ 访问 和 修改 其 他 表 ; 

- 打印 信息 性 消息 ; 

“ 指定 复杂 的 限制 。 


例如 ， 考 虑 一 个 基本 的 学 院 或 大 学 的 学 生 入 学 数据 库 。 一 个 课程 可 以 有 多 名 学 生 参加 ， 一 名 学 生 可 以 参加 多 门 课程 。 触 发 器 
可 以 用 来 支持 以 下 情况 : 


“ 大 学 设置 了 一 个 限制 ， 假 如 每 学 期 每 个 学 生 可 以 报名 参加 的 课程 数 是 五 门 。 可 以 编写 触发 器 检查 不 超过 5 行 数据 插入 同一 
学 生 的 选课 表 。 同 样 ， 如 果 课 程 的 人 数 需 要 限制 ， 也 可 以 编写 触发 器 检查 插入 选课 表 的 学 生 人 数 没有 超过 限制 的 人 数 。 


. 可 以 创建 触发 器 ， 确 保 每 学 期 至 少 为 每 位 教授 分 配 一 门 课程 ， 或 限制 每 位 教授 每 学 期 可 以 担任 的 课程 数量 。 
“ 触发 器 可 用 来 执行 计算 ， 如 确保 某 学 生 本 学 期 已 支付 适当 的 学 费 。 

. 触发 器 可 以 编码 ， 以 确保 该 学 生 已 成 功 完成 先 修 课程 。 

使 用 触发 器 可 以 实现 的 业务 规则 ， 多 的 超出 了 你 的 想象 ， 或 更 确切 地 说 ， 超 出 了 你 的 业务 需求 。 


使 用 触发 器 可 以 实现 的 业务 规则 ， 多 的 超出 了 你 的 想象 。 


触发 器 什么 时 候 触 故 


触发 器 可 以 在 两 个 不 同 的 时 间 触 发 : 触发 活动 发 生前 或 触发 活动 发 生 后 。“ 前 ”触发 器 在 触发 活动 前 执行 ，“ 后 ”触发 器 在 
触发 活动 后 执行 。 


有 些 DBMS 支 持 “ 前 ”和 “后 ”触发 器 ， 而 有 些 仪 支持 一 种 类 型 的 触 友 。 了 解 触发 器 如 何在 数据 库 中 发 挥 作 用 很 有 必要 。 缺 
乏 这 方面 的 知识 ， 就 不 能 对 触发 器 的 正常 功能 进行 有 效 的 编码 、 支 持 和 维护 。 


例如 ， 考 虑 触发 活动 发 生 在 触发 器 触发 之 前 的 情况 。 换 句 话 说 ，UPDATE、1INSERT 或 DELETE 先 发 生 ， 然 后 此 操作 导致 触发 
器 逻辑 执行 。 如 果 有 必要 ， 触 发 代码 能 够 用 来 回 滚 数据 修改 。 但 如 果 和 触发 器 在 实际 触发 事件 发 生前 触发 呢 ? 在 这 种 情况 下 ， 不 需 
要 回 滚 触 发 事件 代码 ， 因 为 它 尚未 发 生 。 然 而 ， 同 一 事务 中 触发 事件 以 前 发 生 的 任何 数据 修改 都 需要 回 滚 。 


如 果 同 一 个 表 中 有 多 个 触发 器 ， 哪 个 触发 器 先 触 上 友 ” 这 与 触发 器 如 何 编码 、 测 试 和 维护 有 关 。 规 则 的 执行 顺序 依赖 DBM 。 
例如 ，DB2 按 照 触发 器 创建 的 顺序 ， 对 同一 个 表 中 相同 类 型 的 触发 器 进行 触发 。 如 果 同 一 个 表 中 存在 两 个 DELETE 触 发 器 ， 哪 个 
先 创建 就 先 执行 哪个 。 一 定 要 了 解 DBMS 触 发 触发 器 的 方式 ， 在 对 数据 库 进 行 修改 时 才能 做 到 心中 有 数 。 如 果 你 需要 删除 并 重建 
一 个 表 来 实现 模式 变更 ， 一 定 要 确保 触发 器 创建 的 顺序 可 以 保持 功能 不 变 。 


触发 器 执行 的 顺序 依赖 DBMS。 


REARS 


正如 已 经 了 解 到 的 ， 触 发 器 由 INSERT、UPDATE 或 DELETE 触 发 。 然 而 ， 触 发 器 本 身 也 可 以 包含 INSERT、UPDATE 和 
DELETE 语 句 。 因 此 ， 数 据 修 改 所 触发 的 触发 器 ， 可 能 会 导致 另 一 个 数据 修改 触发 另 一 个 触发 器 。 当 触发 器 包含 INSERT、 
UPDATE 和 /或 DELETE 逻 辑 时 ， 触 发 器 称 为 谨 套 触发 器 。 


然而 ， 大 多 数 DBMS 限 制 单 个 触发 事件 可 以 执行 的 庶 套 触发 器 的 数量 。 如 果 不 这 样 做 ， 触 发 器 很 有 可 能 无 限 循环 触发 ， 直 到 
所 有 数据 从 整个 数据 库 中 删除 。 


如 果 RI 与 触发 器 相 结合 ， 就 可 能 会 发 生 级 联 UPDATE 和 /或 DELETE 操 作 。 如 果 一 个 UPDATE 或 DELETE 导 致 一 系列 需要 传播 
到 其 他 表 的 UPDATE 或 DELETE， 第 二 个 表 的 UPDATE 或 DELETE 触 发 器 也 将 激活 。 这 种 多 个 触发 器 和 参照 约束 的 组 合 能 够 引起 级 
联 效应 ， 可 能 会 导致 多 处 数据 被 修改 。 为 了 防止 无 限 循环 ，DB2 将 这 种 级 联 效应 限制 到 16 级 ， 如 果 发 生 的 肉 套 超过 16 级 ， 事 务 
就 会 中 止 。 其 他 DBMS 提 供 启 用 和 禁用 级 联 触 发 器 的 选项 。 


谋 套 触 友 器 的 功能 为 实现 自动 数据 完整 性 提供 了 一 种 有 效 的 方法 。 由 于 触发 器 通常 无 法 绕 开 ， 它 们 为 业务 规则 的 强制 应 用 提 
供 了 一 个 绝妙 的 解决 方案 。 但 是 ,使 用 时 要 确保 不 会 达到 最 大 触发 谋 套 级 别 。 否 则 ， 可 能 会 导致 某 些 类 型 的 更 新 根本 无 法 进行 。 


谋 套 触发 器 为 实现 自动 数据 完整 性 提供 了 一 种 有 效 的 方法 。 
使 用 触发 器 来 实现 参照 完整 性 


触发 器 的 一 个 常见 用 途 是 支持 RI。 可 以 编写 触发 器 (代替 RI 声 明 ) 来 支持 你 希望 的 任何 类 型 的 参照 约束 。 当 然 ， 当 使 用 触发 
器 时 ， 需 要 为 每 个 约束 的 每 个 规则 编写 程序 代码 ， 而 DDL 中 编写 的 声明 RI 约 束 用 于 创建 天 系 表 。 


可 以 编写 触发 器 来 支持 任何 类 型 的 参照 约束 。 
有 关 使 用 触发 器 支持 RI 的 更 多 讨论 ， 请 参阅 本 章 后 面 的 内 容 。 
转换 变量 和 表 


为 了 使 用 触发 器 来 支持 BR 规则 ， 有 时 需要 知道 哪些 值 受 到 触发 触发 器 的 动作 的 影响 。 例 如 ， 考 虑 一 个 触发 器 因为 删除 行 而 触 
发 的 情况 。 由 于 触发 动作 发 生 后 触发 器 才 运 行 ， 该 行 以 及 所 有 的 值 都 已 经 被 删除 。 如 果 这 样 ， 该 如 何 用 这 些 值 确 定 参照 连接 的 行 
是 否 人 存在 ?这 就 可 能 需要 使 用 其 原始 的 、 未 经 修改 的 格式 来 访问 它们 。 


每 个 DBMS 访 问 触发 器 修改 前 后 的 数据 版 本 的 方法 都 不 相同 。 在 Sybase 和 Microsoft SQL Server 中 ， 触 发 器 使 用 名 为 
INSERTED 和 DELETED 的 表 ; 在 DB2 中 ， 触 发 器 指定 OLD 和 NEW。 不 管 名 称 是 什么 ， 这 些 表 统称 为 转换 表 (参见 图 13-2) 。 


lH 
插入 一 > 插入 的 内 容 
删除 删除 的 内 容 
图 13-2 ”转换 表 


每 个 触发 器 有 两 个 表 : 一 个 是 数据 的 “前 ”了 映像 ; 另 一 个 是 数据 的 “后 ”了 映像 。 转 换 表 只 能 从 触发 器 访问 。 对 于 Sybase 和 
Microsoft SQL Server， 转 换 表 的 操作 如 下 : 


转换 表 只 能 从 触发 器 访问 。 
- 当 INSERT 发 生 时 ， 持 入 的 表 包 含 刚刚 插入 触发 器 附加 表 中 的 行 。 
. 当 DELETE 发 生 时 ， 删 除 的 表 包含 刚刚 从 触发 器 附加 表 中 删除 的 行 。 


- 当 UPDATE 发 生 时 ， 视 作 一 个 DELETE 和 一 个 INSERT 操 作 ， 插 入 的 表 包 含 该 表 刚 刚 更 新 的 行 的 新 值 ， 删 除 的 表 包 含 更 新 
的 行 的 旧 值 《进行 更 新 之 前 ) o 


DB2 和 Oracle 实 施 转换 表 (或 变量 ) 更 简单 ， 其 工作 原理 如 下 : 

- 当 INSERT 发 生 时 ， 播 入 的 值 可 以 使 用 NEW 转 换 变 量 参照 。 

- 当 DELETE 发 生 时 ， 删 除 的 值 可 以 使 用 OLD 转换 变量 参照 。 

当 UPDATE 发 生 时 ， 播 入 的 值 可 以 使 用 NEW 和 参照， 删除 的 值 可 以 使 用 OLD 参照 。 


触发 器 示例 


有 时 ， 研 究 一 段 示 例 代 码 可 以 帮助 你 弄 清 概念 。 快 速 看 一 个 (DB2) 触发 器 : 


CREATE TRIGGER salary_update 
BEFORE UPDATE OF salary 
ON emp 
FOR EACH ROW MODE DB2SQL 


WHEN (new.salary > (old.salary * 1.5)) 
BEGIN atomic 


SIGNAL SQLSTATE '75001' 


C'Raise exceeds 50%'); 
END; 


此 触发 器 确保 salary 列 的 值 不 能 由 任何 单 次 更 新 增加 50% 以 上 。 注 意 使 用 转换 变量 检查 更 新 后 的 salary， 并 比较 以 前 的 
salary. 


触发 粒度 


因为 SQL 是 一 个 集 级 语言 ， 任 何 单一 的 SQL 语句 都 可 以 影响 多 行 数据 。 例 如 ， 一 个 DELETE 语 句 实际 上 可 以 导致 删除 零 个 、 


Wo 


因此 ， 触 发 器 可 以 有 两 个 级 别 的 粒度 : 语句 级 或 行 级 。 语 名 级 能 发 器 只 在 触发 后 执行 ， 不 管 实际 插入 、 删 除 或 更 新 的 行 
数 。 行 级 触发 器 ,一 旦 触发 ， 只 能 在 每 个 插入 、 删 除 或 更 新 的 行 执行 一 次 。 


触发 器 可 以 有 语句 级 或 行 级 粒度 。 


不 同 的 业务 需求 ， 推 动 选择 的 触发 粒度 的 类 型 。 但 请 记 住 ， 行 级 触发 器 可 能 对 性 能 有 重大 的 影响 ， 因 为 它 要 为 发 出 的 每 个 
SQL 数据 修改 语句 运行 多 次 。 


INSTEAD OF 触发 器 


另外 一 个 类 型 的 触发 器 (INSTEAD OF 触发 器 ) ， 明 显 不 同 于 其 他 三 种 类 型 的 触发 器 。INSTEAD OF 触发 器 定义 在 视图 上 ， 
包含 使 不 可 更 新 的 视图 变 成 可 更 新 的 视图 所 需 的 逻辑 。 同样 地 ，INSTEAD OF 触发 器 有 INSERT、UPDATE 和 DELETE 类 型 。 


可 以 创建 INSTEAD OF 触发 器 ， 使 不 可 更 新 的 视图 变 成 可 更 新 的 视图 。 


通常 情况 下 ， 含 多 个 基 表 的 视图 不 能 更 新 ， 但 是 ， 有 了 INSTEAD OF 触发 器 ， 这 个 问题 就 可 以 迎刃而解 了 。INSTEAD OF 触 
发 器 可 以 直接 插入 、 更 新 和 删除 视图 的 相应 基 表 。 使 用 INSTEAD OF 触发 器 时 ， 应 用 程序 代码 不 必 包 括 复杂 的 算法 来 指定 哪些 操 
作 是 针对 视图 进行 的 ， 哪 些 操作 是 针对 基 表 进行 的 。 相 反 ， 所 有 操作 都 是 针对 视图 进行 的 ， 激 活 的 触发 器 决定 哪些 基 表 将 受到 影 
响 。 


INSTEAD OF 触发 器 的 一 种 思考 方式 是 ， 它 们 在 视图 内 部 含有 反 逻 辑 。 如 果 视 图 与 表 连 接 ， 触 发 器 应 分 开 该 连接 才能 修改 正 
确 的 数据 。 在 给 定 的 主题 视图 中 ， 每 个 类 型 的 操作 只 人 允许 有 一 个 INSTEAD OF 触发 器 ， 即 一 个 用 于 插入 ， 一 个 用 于 更 新 ， 一 个 用 
于 删除 。 因 此 ， 每 个 视图 可 以 有 三 个 INSTEAD OF 触发 器 。 


触发 器 介绍 


触发 器 是 现代 DBMS 产 品 的 一 种 强大 功能 。 触 发 器 使 DBA 能 够 创建 本 质 上 夹杂 着 数据 的 不 可 绕 开 的 、 受 事件 驱动 的 逻辑 。 但 
是 ， 在 实施 触发 器 前 ， 需 要 了 解 支持 活动 的 数据 库 环 境 所 需 的 其 他 DBA 职 责 。 这 些 问题 在 1.12.1 节 中 有 讨论 。 


13.3.7 ”人 参照 完整 性 


Ann GLE. 
参照 完整 性 是 一 种 确保 DBMS 中 数据 “正确 ”的 方法 。 人 们 往往 过 于 简化 RI， 说 明 它 仅 标 识 关 系 表 之 间 的 关联 。 实 际 上 远 不 
止 于 此 。 构 成 表 之 间 关 联 的 主 码 和 外 码 的 标识 是 定义 参照 完整 性 的 一 个 组 成 部 分 。 
参照 完整 性 是 确保 数据 “正确 ”的 方法 。 


RI 通过 建立 管理 关联 的 规则 ， 体 现 了 关联 的 完整 性 和 可 用 性 。 主 码 和 外 码 列 ， 以 及 决定 数据 可 以 放 在 这 些 列 的 规则 的 组 合 ， 
是 了 解 和 使 用 RI 来 确保 正确 的 、 有 用 的 关系 数据 库 的 开始 。 


RI 规 则 ， 适 用 于 每 个 关联 ， 可 以 确定 外 码 列 插入 或 更 新 时 的 状态 ， 以 及 主 码 行 删除 或 更 新 时 ， 相 关 行 的 状态 。 一 般 情 况 下 ， 
外 码 的 值 必须 始终 位 于 外 码 值 (当前 主 码 列 的 值 ) 的 域内 ， 或 设 为 空 值 。 


RI 的 概念 ， 在 下 面 的 “快速 和 脏 ” 定 义 中 概括 为 : RI 保证 外 码 列 的 值 始 终 可 以 接受 。“ 可 接受 ”按照 放 在 对 应 主 码 中 的 适当 
值 进行 定义 ， 也 可 以 为 空 。 


参照 完整 性 保证 外 码 列 的 值 始终 可 以 接受 。 
关联 和 该 关联 的 规则 的 组 合 称 为 参照 的 来。 伴随 RI 定 义 的 规则 与 关联 一 样 重 要 。 


另外 两 个 重要 的 RI 术语 是 父 表 和 子 表 。 对 于 任何 给 定 的 参照 约束 ， 父 表 是 包含 主 码 的 表 ， 子 表 是 包含 外 码 的 表 。 参 见 图 13- 
3。employed-by 关 联 中 的 父 表 是 DEPT 表 ， 子 表 是 EMP 表 。 所 以 主 码 (如 DEPT-NO) 驻 留 在 DEPT 表 中 ， 数 据 类 型 和 长 度 相同 
但 列 名 不 一 定 相同 的 外 码 ， 存 在 于 EMP 表 中 。 


A13-3 RREFR 


每 个 参照 约束 可 以 附加 三 种 类 型 的 规则 : 一 个 INSERT 规 则 、 一 个 UPDATE 规 则 和 一 个 DELETE 规 则 。 下 面 介绍 这 些 规则 如 何 
管理 参照 约束 。 


每 个 参照 约束 可 以 附加 三 种 类 型 的 规则 。 


INSERT 规 则 


INSERT 规 则 表明 如 果 你 试图 插入 值 到 外 码 列 而 父 表 中 没有 相应 的 主 码 值 会 发 生 什 么 。RI 插 入 规则 有 两 个 方面 : 


1. 绝 对 不 允许 插入 行 到 从 属 表 中 ， 且 外 码 值 不 对 应 主 码 值 。 这 就 是 所 谓 的 限制 插入 规则 。 


2. 实 际 值 必 须 指定 ， 不 能 是 空 值 。 


对 于 每 一 个 关联 ， 初 次 向 表 中 插入 行 ，DBA 必 须 决定 是 否 要 指定 外 码 值 。 为 了 确定 这 一 点 ， 考 虑 下 面 的 问题 “在 业务 方 
A, 添加 从 属 行 ， 需 要 知道 父 表 中 的 主 码 值 吗 ? ” 


如 果 指定 外 码 值 ， 它 必须 等 于 父 表 当 前 主 码 列 的 某 个 值 。 这 实现 了 限制 插入 规则 。 如 果 外 码 值 是 可 选 的 ， 可 以 设 为 空 值 。 


UPDATE 规 则 


UPDATE 规 则 的 基本 目的 是 控制 更 新 ， 这 样 外 码 值 就 不 能 更 新 为 与 父 表 主 码 值 不 相关 的 值 。 然 而 ， 有 两 种 方法 可 以 查看 更 新 
规则 : 从 外 码 角 度 来 看 和 从 主 码 角 度 来 看 。 


从 外 码 角 度 来 看 。 一 旦 为 某 行 指定 了 外 码 (无 论 在 插入 时 或 插入 后 ) ， 就 必须 决定 该 值 是 否 可 以 变更 。 这 是 由 联系 的 业务 定 


义 和 关 联 的 表 确 定 的。 然而 ， 如 果 人 允许 变更 外 码 值 ， 新 值 必须 要 么 等 于 目前 父 表 中 的 主 码 值 ， 要 么 为 空 。 
从 主 码 角度 来 看 。 如 果 主 码 值 更 新 ， 有 三 种 方法 处 理 外 码 值 : 
- 受 限 UPDATE。 如 果 外 码 值 存 在 ， 不 允许 修改 主 码 列 。 


- 中 和 UPDATE。 将 所 有 与 修改 的 主 码 值 相等 的 外 码 值 设置 为 空 。 当 然 ， 中 和 UPDATE 允 许 外 码 列 为 空 。 


- 级 联 UPDATE。 所 有 外 码 列 中 ， 只 要 有 一 个 值 与 修改 的 主 码 值 相等 ， 所 有 的 外 码 列 都 可 以 修改 。 


DELETE 规 则 


删除 参照 完整 性 规则 定义 了 试图 从 父 表 中 删除 行 时 会 发 生 什 么 。 与 UPDATE 规 则 从 主 码 角 度 来 看 类 似 ， 从 父 表 中 删除 行 时 也 
有 三 种 选择 : 


- 限制 DELETE。 如 果 外 码 值 存在 ， 不 允许 删除 主 码 行 。 

- 中 和 DELETE。 将 所 有 与 删除 的 主 码 行 值 相等 的 外 码 值 设 为 空 。 

- 级 联 DELETE。 所 有 与 将 删除 的 主 码 行 值 相 等 的 外 码 行 值 也 都 会 删除 。 
FBEADELETE 


最 后 一 种 类 型 的 参照 约束 是 钊 附 DELETE。 子 表 没有 外 码 指 回 主 码 时 ， 可 以 使 用 这 种 特殊 类 型 的 参照 完整 性 处 理 父 表 的 行 。 
吊坠 DELETE RI 指定 它 的 最 后 一 个 外 码 行 删 除 后 ， 父 表 行 即 删除 。 


吊坠 DELETE 的 处 理 不 能 使 用 声明 RI。 但 是 ， 可 以 使 用 触发 器 编写 检查 这 一 条 件 的 程序 逻辑 ， 并 删除 主 码 行 。 
吊 险 DELETE 的 处 理 不 能 使 用 声明 RI。 
表 13-1 总 结 了 参照 完整 性 及 其 适用 的 规则 。 


表 13-1 参照 完整 性 规则 


RI 规则 描 述 
DELETE RESTRICT 如 果 有 任何 行 存在 在 从 属 表 中 ， 父 表 的 主 码 行 就 不 能 删除 
DELETE CASCADE 如 果 有 任何 行 存 在 在 从 属 表 中 ， 删 除了 父 表 的 主 码 行 ， 所 有 的 从 属 行 也 会 删除 
如 果 有 任何 行 存 在 在 从 属 表 中 ， 删 除了 父 表 的 主 码 行 ， 所 有 从 属 行 的 外 人 码 列 都 将 设 
SREE ARTALDE Re 有 任何 行 存在 在 从 属 表 中 ， 删 除了 父 表 的 主 码 行 ， 所 有 从 属 行 的 外 码 列 都 将 设 
UPDATE RESTRICT 如 果 有 任何 行 存在 在 从 属 表 中 ， 父 表 的 主 码 列 就 不 能 更 新 


如 果 有 任何 行 存 在 在 从 属 表 中 ， 更 新 了 父 表 的 主 码 行 ， 从 属 行 的 所 有 外 码 值 都 将 更 
新 为 相同 的 值 

如 果 有 任何 行 存在 在 从 属 表 中 ， 删 除了 父 表 的 主 码 行 ， 从 属 行 的 所 有 外 码 值 都 将 更 
新 为 空 


UPDATE CASCADE 


UPDATE NEUTRALIZE 


RI 规则 Hi ik 
INSERT RESTRICT 除非 父 表 已 经 有 主 码 值 ， 和 否则 不 能 向 从 属 表 搬 和 人 外 码 值 
FOREIGN KEY UPDATE EE RO ican testi aoe, aan stp iat 
f 不 能 将 外 码 更 新 为 一 个 已 经 不 存在 的 值 ， 来 作为 父 表 的 主 码 。 当 删除 从 属 表 的 最 后 
RESTRICTION a RE 
-个 外 码 值 时 ， 父 表 的 主 码 行 也 将 删除 
PENDANT DELETE 
建立 关联 


声明 参照 约束 是 通过 编写 父 表 的 主 码 和 编写 从 属 表 一 个 或 多 个 外 码 来 添加 的 。 约 束 可 以 使 用 CREATE TABLE 和 ALTER 
TABLE 语 句 来 添加 。 当 在 父 表 和 从 属 表 中 执行 声明 的 参照 完整 性 时 ， 必 须 遵 循 一 些 规则 。 


对 于 父 表 : 
- 主 码 必 须 在 CREATE TABLE 或 ALTER TABLE 语 名 中 识别 。 


. 主 码 约束 在 CREATE TABLE 或 ALTER TABILE 语 句 中 指定 时 ，SQL Servet 会 为 主 码 自动 定义 一 个 唯一 的 集群 索引 。 其 他 
DBMS (如 DB2) 需要 DBA 手 动 创建 唯一 索引 来 支持 主 码 。 


对 于 从 属 表 : 
- 引用 父 表 的 外 码 必 须 在 CREATE TABLE 或 ALTER TABLE 语 句 中 识别 。 


虽然 通常 不 要 求 ， 但 强烈 建议 为 外 码 也 定义 一 个 索引 。 外 码 的 索引 不 是 唯一 索引 ， 除 非 定义 一 对 一 的 关联 。 外 码 上 创建 索 
引 将 提高 RI 操作 的 性 能 。 


所 有 的 约束 都 将 命名 ， 无 论 显 式 命名 或 隐 示 命名 。 显 式 命名 DDL 中 的 每 个 参照 约束 更 好 。 否 则 ，DBMS 将 指定 一 个 系统 生成 
的 名 称 ， 使 将 来 的 参照 约束 更 加 困难 。 


声明 性 RI 实施 注意 事项 


有 时 单个 表 内 需要 设立 一 个 参考 约束 。 例 如 ， 部 门 表 可 能 需要 记录 哪个 部 门 是 其 他 部 门 的 下 属 部 门 。MANAGED _BY_DEPT 
列 可 能 需要 成 为 DEPT_NO 主 码 的 外 码 ， 都 在 同一 表 中 。 在 声明 性 RI 约束 中 ， 表 能 够 参照 本 身 。 这 称 为 自 参 照 约 束 。 


触发 触发 器 之 前 检查 约束 。 如 果 声 明 性 RI 约 束 和 触发 器 在 同一 个 表 中 共存 ， 要 确保 它们 互相 兼容 。 例 如 ， 不 应 该 编写 
DELETE 触 发 器 将 外 码 连 同 声明 性 约束 一 起 删除 ， 因 为 声明 性 约束 将 禁止 触 友 器 触发 。 


可 以 修改 表 来 添加 或 删除 声明 性 RI。 事 实 上 ， 在 最 初 的 CREATE TABLE 语 句 中 指定 所 有 的 参照 约束 有 时 是 不 可 能 的 。 父 表 的 
主 码 必 须 在 定义 参照 父 表 的 外 码 之 前 就 存在 。 有 了 自 参照 约束 ， 初 次 创建 表 时 就 可 以 定义 主 码 ， 但 外 码 需 要 在 此 之 后 通过 使 用 
ALTER TABLE 语 句 添加 。 


可 以 修改 表 来 添加 或 删除 声明 性 RI。 
DBMS 支 持 参照 完整 性 


请 记 住 ， 每 个 DBMS 支 持 不 同 级 别 的 声明 性 RI 和 不 同 的 选项 供 其 使 用 。DBA 必 须知 道 哪 些 RI 选 项 是 DBMS 提 供 的 ， 并 对 应 用 
程序 开发 人 员 提 供 指导 ， 以 确定 什么 可 以 由 DBMS 处 理 ， 什 么 必须 编写 程序 代码 。 此 外 ，DBA 必 须 了 解 触发 器 ， 以 及 当 DBMS 中 
缺乏 声明 性 RI 支持 时 ， 如 何 使 用 它们 实施 RI。 


每 个 DBMS 支 持 不 同 级 别 的 声明 性 RI。 


使 用 触发 器 的 参照 完整 性 


如 果 正 在 使 用 的 DBMS 不 提供 应 用 程序 所 需 的 声明 性 RI 功 能 ， 可 以 编写 触发 器 来 代 蔡 RI 声 明 。 使 用 触发 器 ， 可 以 支持 所 有 可 
以 想象 的 RI 规 则 。 当 然 ， 使 用 触发 器 需要 为 每 个 约束 的 每 个 规则 编写 程序 代码 。 使 用 每 个 参照 约束 的 四 种 类 型 的 触发 器 ， 可 以 实 


现 完整 的 参照 完整 性 : 

1. 在 父 表 上 的 DELETE 触 发 器 可 用 于 编写 : 
- DELETE RESTRICT 
- DELETE CASCADE 
- DELETE NEUTRALIZE 

2. 在 父 表 上 的 UPDATE 触 发 器 可 用 于 编写 : 
- UPDATE RESTRICT 

- UPDATE CASCADE 

- UPDATE NEUTRALIZE 

3. 从 属 表 上 的 INSERT 触 发 器 可 用 于 编写 : 
- INSERT RESTRICT 

4. 从 属 表 中 的 UPDATE 触 发 器 可 用 于 编写 这 种 约束 : 外 码 不 能 更 新 为 非 主 码 值 。 


事实 上 ， 可 以 编写 找 套 和 递归 触发 器 来 支持 非常 强大 的 参照 完整 性 实现 。 此 外 ， 触 发 器 在 某 些 情况 下 是 实现 系统 管理 RI 的 唯 
一 自动 方法 ， 如 : 


当 删 除 、 插 入 和 更 新 信息 需要 显 式 参 照 确定 要 采取 的 行动 时 。 和 触发 器 提供 了 一 种 这 么 做 的 方法 ， 很 快 就 会 讨论 到 。 


- 当 DBMS 不 支持 的 RI 规则 很 必要 时 。 例 如 ，Sybase 声 明 性 RI 支持 只 限于 删除 和 更 新 ; DB2 提 供 的 声明 性 RI 支持 只 限于 
DELETE 和 UPDATE， 中 和 DELETE 和 UPDATE， 级 联 DELETE, 但 没有 级 联 UPDATE。 每 个 DBMS 提 供 不 同 程度 的 声明 性 RI 支 
持 。 


- 当 要 求 吊 险 DELETE 处 理 时 。 这 有 时 称 为 “ 反 向 ”RI。 钊 附 DELETE 处 理 的 情况 为 : 当 参 照 父 行 的 最 后 一 个 从 属 行 删除 
时 ， 父 行 必 须 删 除 。 触 发 器 是 实现 这 种 类 型 的 约束 的 唯一 方法 。 


可 以 编写 说 套 和 递归 触发 器 来 支持 非常 强大 的 参照 完整 性 实现 。 


当然 ， 如 果 通 过 使 用 声明 性 RI，RI 需 要 可 以 得 到 满足 ， 应 该 使 用 声明 性 RI 而 不 是 触发 器 。 触 发 器 必须 手工 编写 和 测试 ， 这 意 
味 着 它们 可 能 会 有 缺陷 或 功能 不 正确 。 声 明 性 RI 在 DBM SS 内， 因此 不 太 可 能 失败 (除非 DBMS 本 身 有 错误 ) 。 此 外 ， 声 明 性 RI 大 
多 数 情况 下 都 优 于 基于 触发 器 的 RI。 所 以 ， 声 明 性 RI 优 于 基于 触发 器 的 RI 可 以 作为 一 个 经 验 法 则 。 


下 面 看 一 些 触 发 器 的 例子 ， 弄 清楚 如 何 正确 使 用 转换 表 和 变量 。 以 下 (SQL Server) 的 触发 器 实现 级 联 删除 RI 规 则 : 


CREATE TRIGGER title_del 
ON titles FOR DELETE 
AS 
IF @@rowcount = 0 
RETURN 
DELETE titleauthor 
FROM titleauthor, deleted, title 


WHERE titles.title_id = deleted.title_id 
RETURN 


当 删 除 父 表 中 的 一 个 行 (title) 时 ，DELETE 级 联 到 从 属 表 (titleauthor) 。 第 二 个 例子 如 下 ， 实 现 限 制 的 INSERT RI 规 则 。 
向 从 属 表 插 入 行 时 ， 首 先 要 检查 父 表 中 (title) 是 否 存 在 一 个 可 行 的 主 码 。 


下 面 来 看 另 一 个 例子 。 编 写 以 下 的 触发 器 来 实现 限制 的 INSERT RI 规则 。 向 从 属 表 (titleauthor) 插入 行 时 ， 首 先 要 检查 父 
表 中 (title) 是 否 存 在 一 个 可 行 的 主 码 。 


CREATE TRIGGER title_ins 
ON titleauthor FOR INSERT 
AS 
DECLARE @rc int 
SELECT @rc = @@rowcount 
IF @rc = 0 
RETURN 
IF (select count(*) 
FROM titles, inserted 
WHERE titles.title_id = inserted.title_id) !=@rc 
BEGIN 
RAISERROR 20001 "Invalid title: title_id 
does not exist on titles table" 
ROLLBACK transaction 
RETURN 
END 
RETURN 


最 后 描述 一 个 中 和 更 新 的 例子 (SQL Server) : 


CREATE TRIGGER title_upd 
ON titles FOR UPDATE 
AS 
IF UPDATE (title_id) 
IF (select count(*) 
FROM deleted, titles 
WHERE deleted.title_id = title.titleid) = 0 
BEGIN 
UPDATE titleauthor 


SET titleauthor.titleid = null 
FROM titleauthor, deleted 
WHERE titleauthor.titleid = deleted.title_id 
END 
RETURN 


首先 要 检查 title id 是 否 更 新 。 如 果 更 新 ， 进 行 触发 器 检查 确保 title_ id 没有 更 新 为 它 之 前 的 值 。 如 果 是 ， 中 和 更 新 不 应 该 发 
生 。 如 果 这 两 项 检查 都 通过 了 ， 更 新 发 生 。 更 新 父 表 中 的 一 个 行 (title) 时 ， 要 检查 所 有 相关 的 行 是 否 都 在 从 属 表 
(titleauthor) 中 。 如 果 是 这 样 ， 外 码 列 必须 设 为 空 。 


用 户 管理 与 系统 管理 的 RI 


系统 管理 声明 性 RI 并 非 一 直 可 用 ， 安 装 的 应 用 程序 中 可 能 已 经 存在 用 户 管 理 的 RI。 在 这 种 情况 下 ， 同 时 支持 用 户 和 系统 管理 
的 RI 可 能 很 有 必要 。 


同时 支持 用 户 和 系统 管理 RI 可 能 很 有 必要 。 


此 外 ， 即 使 系统 管理 的 RI 可 用 ， 有 时 用 户 管 理 的 RI 可 能 更 合适 。 一 个 实例 : 当 应 用 程序 必须 始终 访问 父 表 和 从 属 表 时 (甚至 
实施 系统 管理 的 RI 时 ) 。 例 如 ， 考 虑 一 个 应 用 程序 ， 始 终 在 向 ORDR_ITEM_TAB (从 属 表 ) 插入 order 之 前 ， 先 将 order 行 插入 
ORDER TAB ( 父 表 ) 中 ; 另 一 个 应 用 程序 ， 始 终 先 访问 位 于 ORDR_ITEM_TAB 表 中 行 的 历史 信息 ， 再 将 这 些 信息 删除 ， 然 后 从 
ORDR_TAB 表 中 删除 父 行 。 由 于 这 些 应 用 程序 访问 了 两 个 表 ， 系 统管 理 RI 的 额外 开销 太 大 。 


然而 ， 系 统管 理 RI 的 好 处 是 临时 访问 (如 交互 式 SQL 和 数据 仓库 查询 ) 期 间 ， 还 可 以 强制 执行 数据 的 完整 性 。 当 RI 仅 保持 在 
程序 中 时 ， 如 果 在 控制 RI 的 应 用 程序 之 外 允许 进行 数据 修改 ， 可 能 会 违反 数据 的 完整 性 。 通 常 明智 的 做 法 是 实现 系统 管理 RI 而 不 
是 用 户 管理 的 RI。 但 要 记 住 ， 大 多 数 DBM 9 提供 两 个 方法 实现 系统 管理 的 RI: 声明 性 约束 和 触发 器 。 


RI、 检 查 约 束 和 程序 逻辑 


参照 完整 性 、 检 查 约 束 和 编写 应 用 程序 逻辑 都 是 执行 数据 完整 性 的 有 效 方法 。 本 章 详 细 介 绍 了 每 个 功能 及 其 优势 。 现 在 ， 停 
下 来 看 一 下 实施 每 种 方法 的 特定 要 求 和 影响 。 


考虑 比较 域 的 后 果 。 例 如 ， 假 设 创 建 数据 库 时 有 三 个 有 效 的 员工 类 型 : T (临时) 、F (SER) 和 C (合同 ) 。 在 实施 后 新 增 
了 第 四 个 员工 类 型 ， 即 P (RER) 。 一 种 简单 的 方法 是 ,创建 员工 类 型 表 存 储 值 ， 使 用 RI 支持 新 值 。 为 了 支持 新 的 类 型 ， 需 要 做 
的 就 是 插入 一 行 到 员工 类 型 表 中 ， 参 照 约束 现在 将 允许 新 值 。 


使 用 检查 约束 来 支持 这 种 新 值 ，DBA 很 可 能 会 要 求 删除 并 重建 检查 约束 。 检 查 约束 不 存在 期 间 ， 需 要 中 断 ， 否 则 可 能 会 违 
反 数 据 完整 性 。 当 然 ， 要 求 24/7 环 境 时 ， 这 样 的 情景 应 该 避免 。 


最 后 ， 如 果 需 要 程序 逻辑 支持 新 值 的 域 ， 程 序 员 必须 要 修改 程序 、 测 试 ， 然 后 将 其 迁移 到 生产 环境 中 。 这 比 前 两 个 情景 多 很 


多 工作 量 。 
那么 ， 作 为 一 个 经 验 法 则 ， 使 用 DBMS 的 设施 来 实施 数据 的 完整 性 ， 除 非 存 在 一 个 非常 令 人 信服 的 不 这 样 做 的 理由 。 


尽 可 能 使 用 DBMS 的 设施 来 实施 数据 的 完整 性 。 


RI 经 验 法 则 


不 管 计划 在 数据 库 中 实施 哪 种 类 型 的 RI， 都 应 该 注意 以 下 经 验 法 则 。 


要 知道 ， 有 一 些 的 情况 可 以 绕 开 参照 完整 性 。 这 可 能 会 导致 严重 的 数据 完整 性 问题 以 及 重大 混乱 。 对 于 大 多 数 的 DBMS， 一 
个 常见 的 问题 是 BULK LOAD 实 用 程序 。 向 数据 库 表 中 加 载 数据 ， 而 不 检查 外 码 参照 会 加 快 加 载 过 程 。 然 而 ， 这 也 意味 着 ， 大 容 
量 的 数据 加 载 过 程 中 可 能 会 引入 数据 完整 性 问题 。 


此 外 ， 一些 DBMS 提 供 可 以 打开 和 关闭 RI 的 SQL 开 关 。 应 避免 使 用 ， 因 为 关闭 RI 很 容易 引起 数据 的 完整 性 问题 。 程 序 和 | 临时 
数据 修改 都 可 能 插入 或 更 新 外 码 列 ， 且 该 列 的 值 不 符合 父 表 中 任何 现 有 的 主 码 值 。 


主 码 列 和 外 码 列 可 以 有 不 同 的 名 称 、 空 属性 限定 符 (例如 ，NULL 与 NOT NULL) 和 默认 值 。 列 的 属性 ( 例 
如 ，CHAR (5) ) 必须 是 相同 的 。 在 不 同属 性 的 两 列 之 间 创 建 声明 约束 是 不 可 能 的 。 同 样 地 ， 不 同属 性 的 两 列 之 间 创 建 基于 触 
发 器 的 约束 也 是 不 明智 的 (尽管 可 能 ) 。 


记 住 ， 当 从 属 行 存在 多 种 关联 时 ， 必 须 对 它们 进行 验证 ， 才 能 插入 新 行 。 插 入 行 可 以 通过 四 个 参照 约束 中 的 三 个 ， 但 第 四 个 
可 能 会 失败 。 


组 合 码 用 于 “ 主 码 -外 码 ” 关 联 时 ， 父 表 中 必须 存在 单个 行 ， 其 键 值 与 插入 从 属 表 的 行 的 折 有 外 码 列 相 匹 配 。 

一 般 情 况 下 ， 应 避免 使 用 声明 RI 创 建 非常 大 的 一 组 参照 相关 表 。 参 照相 关 表 的 组 越 大 ， 越 难以 管理 。 请 记 住 参照 相关 表 必 须 
一 起 备份 和 恢复 ， 以 保持 关联 完好 。 

参照 相关 表 必 须 一 起 备份 和 恢复 。 


对 于 小 且 相 对 静态 的 代码 表 和 参考 表 ， 考 虑 使 用 检查 约束 而 不 是 参照 约束 。 如 果 表 中 的 值 很 小 ， 检 查 约束 可 能 会 优 于 参照 约 
束 。 例 如 ， 考 虑 一 个 表 ， 包 含 项 目的 状态 代码 ， 如 表 13-2 所 以 。 相 反 ， 可 以 简单 地 编写 一 个 检查 约束 包括 任何 子 表 中 的 这 些 


值 ,例如 : 


CREATE TABLE PROJECT 


(projno INTEGER PRIMARY KEY, 
deptno INTEGER NOT NULL, 
mg_empno INTEGER, 
status INTEGER NOT NULL 


CHECK (status BETWEEN 0 AND 3), 
start_date DATE, 
) IN db.ts; 


表 13-2 ” PROJECT _ STATUS 代码 


STATUS_CODE STATUS_CODE Ho j 
0 项 目 还 没有 开始 项 目 完成 


对 于 PROJECT_ STATUS 表 ( 见 表 13-2) 的 STATUS_ CODE 列 ， 状 态 列 的 检查 约束 与 状态 列 的 外 码 所 执行 的 功能 相同 。 并 且 
检查 约束 更 有 效 。 但 是 ， 如 果 项 目 状态 代码 频繁 改变 ， 使 用 检查 约束 维护 值 比 添加 值 到 PROJECT_STATUS 表 更 难 。 


13.4 “时 态 数据 库 系 统 


回顾 第 4 章 ， 时 态 DBM 使 存储 不 同 的 数据 库 状 态 和 查询 这 些 不 同 状态 的 数据 变 为 可 能 。 为 了 管理 数据 的 时 态 完整 性 ， 提 供 
时 态 支持 的 DBMS 必 须 分 别 定义 。 时 态 数 据 库 中 存储 的 数据 不 同 于 传统 的 数据 ， 前 者 的 数据 会 添加 一 个 时 间 段 ， 表 示 数 据 在 数据 
库 中 何 时 有 效 或 被 修改 。 

时 态 DBMS 使 存储 不 同 的 数据 库 状态 和 查询 这 些 不 同 状 态 的 数据 变 为 可 能 。 

时 态 数据 库 的 实现 需要 为 指示 每 一 行 有 效 时 间 范 围 的 表 设 置 约 束 。 这 通常 是 通过 指定 业务 或 系统 时 间 周 期 的 开始 和 结束 日 期 
来 完成 的 。 例 如 ， 考 虑 下 面 的 DDL 创 建 一 个 新 的 具有 业务 时 间 说 明 的 表 : 


CREATE TABLE COURSE 


(COURSENO INTEGER NOT NULL, 
TITLE VARCHAR(20) NOT NULL, 
CREDITS SMALLINT NOT NULL WITH DEFAULT 3, 
PRICE DECIMAL(7,2) NOT NULL, 
BUS_START DATE NOT NULL, 
BUS_END DATE NOT NULL, 


PERIOD BUSINESS _TIME(BUS_START, BUS_END), 


PRIMARY KEYCCOURSENO, BUSINESS TIME WITHOUT OVERLAPS) 


在 这 个 例子 中 ， 指 定 了 两 个 DATE 列 ， 表 明 时 间 段 的 开始 (BUS START) 和 结束 (BUS END) . PERIOD 
BUSINESS_TIME 子 句 用 于 指定 两 列 以 确定 时 间 周 期 。 通 过 强制 BUS_START 值 始终 在 BUS_END 值 的 前 面 ， 确 保 数 据 的 时 态 完整 
性 。DBMS 可 以 自动 生成 隐 式 的 约束 来 强制 这 种 状况 。 


WITHOUT OVERLAPS 子 句 被 指定 为 表 中 主 码 约束 的 一 部 分 。 这 表明 ， 对 于 业务 时 间 内 的 任何 时 间 点 ， 主 码 值 必须 是 唯一 
的 。 换 名 话说， 一 个 课程 不 可 能 有 两 种 状态 或 版 本 同时 有 效 。 如 果 WITHOUT OVERLAPS 未 指定 ， 可 能 发 生 重 皮 。 


数据 〈 包 括 时 间 段 日 期 ) 必须 由 应 用 程序 提供 。 所 有 数据 (包括 过 去 、 现 在 和 将 来 的 生效 日 期 行 ) 都 要 在 表 中 维护 。 时 态 
SQL 使 指定 时 态 谓词 (如 As OF, FROM/TOFIBETWEEN) 的 查询 能 发 出 。 例 如 ， 下 面 的 SQL 选择 截止 到 2012 年 4 月 3 
日 ，English 101 课 程 的 价格 : 

SELECT Price 


FROM Course FOR BUSINESS TIME AS OF '2012-04-03' 
WHERE Title = ‘ENGLISH 101'; 


如 果 要 在 表 中 修改 数据 ， 时 态 约 束 也 很 有 帮助 。 插 入 数据 为 所 有 需要 的 列 (包括 业务 时 间 开始 和 结束 列 ) 提供 适当 的 值 是 一 
件 简 单 的 事情 。 如 果 在 表 中 定义 了 时 态 的 唯一 性 约束 ，DBM 会 检查 任何 企图 的 INSERT， 以 确保 它 不 会 与 现 有 的 时 间 段 冲突 。 


在 时 态 表 中 更 新 数据 ， 可 以 编写 传统 的 UPDATE 语 句 。 或 者 也 可 以 使 用 新 的 FOR PORTION OF BUSINESS _ TIME 语句 来 限 
制 UPDATE 特 定 的 业务 时 间 段 。 时 态 语法 很 强大 ， 因 为 跨越 多 个 时 间 段 的 UPDATE 由 DBMS 通 过 适当 修改 时 间 范 围 来 管理 。 例 
如 ， 考 虑 介绍 DBA 类 的 Course 表 中 的 数据 如 下 : 


CourseNo Title Credits Price Bus Start Bus_End 
100 INTRO TO DBA 3 300.00 2011-10-01 2012-01-01 
100 INTRO TO DBA 3 350.00 2012-01-01 9999-12-31 


假设 你 需要 变更 这 门 课 程 在 2011 年 11 月 1 日 到 2012 年 2 月 2 日 期 间 的 价格 。 此 UPDATE 跨 越 了 课程 两 个 现 有 的 行 ， 因 为 它 在 
第 一 行 的 时 间 段 开始 ， 在 第 二 行 的 时 间 段 结束 。 当 然 ， 你 可 以 发 出 几 个 UPDATE 和 INSERT 语 句 调 整数 据 来 实现 想 要 的 变更 。 但 
使 用 如 下 的 FOR PORTION OF BUSINESS _ TIME 语句 更 简单 : 

UPDATE Course 

FOR PORTION OF BUSINESS TIME FROM '2011-11-01' TO '2012-02-02" 


SET Price = 325.00 
WHERE CourseNo = 100; 


这 两 个 行 都 受 UPDATE 语 句 的 影响 ， 因 为 更 新 的 业务 时 间 部 分 与 每 行 的 业务 时 间 段 部 分 重 晋 。 为 了 进行 这 种 变更 ，DBMS 将 
两 个 原始 行 都 分 成 两 行 。 这 些 行 (447) 的 时 间 段 都 已 作 相 应 的 调整 ， 符 合 UPDATE 和 变更 的 列 值 的 要 求 。 (在 这 种 情况 
下 ，Price 应 用 到 相应 的 行 。) 这 一 UPDATE 语 句 发 出 之 后 ，CourseNo 100 的 数据 包含 四 行 ， 而 不 是 两 行 ， 每 个 都 有 相应 的 时 态 


范围 。 


你 也 可 以 从 具有 业务 时 间 段 的 表 中 DELETE 数 据 。 你 可 以 使 用 标准 的 DELETE 语 句 (这 会 影响 与 时 间 段 不 相关 的 行 ) ， 也 可 以 
使 用 FOR PORTION OF BUSINESS TIME 语句 限制 DELETE 的 时 间 范 围 。 与 UPDATE 类 似 ， 删 除 不 完全 包含 在 指定 时 间 范 围 内 的 
数据 时 ，DBMS 会 采取 适当 的 措施 ， 保 留 那些 必须 要 保留 的 数据 。 


时 态 支持 为 在 数据 库 中 管理 时 间 提 供 了 强大 的 约束 。 但 是 ， 请 记 住 ， 不 是 每 个 DBMS 都 提供 时 态 支持 。z/OS DB2 的 版 本 10 
就 是 一 个 例子 。 


135. Na 


当今 的 DBMS 提 供 了 丰富 的 功能 来 支持 数据 完整 性 。 因 为 困扰 生产 系统 的 主要 问题 之 一 是 数据 质量 ，DBA 了 解 、 实 施 和 管理 
DBMS 的 功能 (如 约束 、 照 完整 性 和 在 数据 库 设 计 的 触发 器 ) 很 有 必要 。 如 果 不 这 样 做 ， 可 能 会 引起 很 严重 的 后 果 。 


然而 ,没有 DBMS 可 以 确保 其 数据 的 完整 性 在 所 有 时 间 都 100% 可 靠 。 可 能 还 需要 其 他 方法 (程序 、 手 动 检查 、 自 动 数据 清 
理 和 数据 质量 产品 ) 来 保证 特定 数据 库 的 质量 。 


没有 DBMS 可 以 确保 其 数据 的 完整 性 在 所 有 时 间 都 100% 可 靠 。 


然而 ， 每 个 DBA 都 应 该 利用 DBMS 提 供 的 机 制 来 确保 数据 的 完整 性 。 使 用 DBM 提供 的 方法 时 ， 数 据 库 中 数据 的 完整 性 问题 
可 能 会 比较 少 。 此 外 ， 数 据 的 完整 性 问题 越 少 ， 就 意味 着 数据 库 的 质量 越 高 ， 终 端 用 户 对 数据 完整 性 越 精通 。 


13.6 ”回顾 


1. 请 说 出 实体 完整 性 的 定义 。 

2. 描 述 数 据 库 结构 完整 性 和 语义 数据 完整 性 之 间 的 差异 。 

3. 在 关系 数据 库 中 实施 参照 完整 性 的 首选 方法 是 什么 ? 

4. 什 么 是 触发 器 ， 触 发 器 如 何 用 于 增强 数据 的 完整 性 ? 

5. 检 查 约 束 和 规则 之 间 的 区 别 是 什么 ? 

6. 什 么 是 转换 变量 和 表格 ， 他 们 提供 什么 样 的 好 处 ? 

7. 命 名 和 描述 DBA 可 能 会 遇 到 的 四 类 数据 库 结构 完整 性 问题 。 

8. 什 么 是 用 户 定义 的 数据 类 型 ， 以 及 它 如 何 可 以 被 用 来 提高 数据 的 完整 性 ? 

9. 描 述 三 种 RI 删 除 规则 和 当 父 表 中 的 主 码 行 发 出 删除 时 ， 对 子 表 中 外 码 行 的 影响 。 


10. 描 述 时 间 数 据 库 范围 内 的 开始 和 结束 日 期 /时 间 列 的 目的 。 
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第 14 章 ”数据 库 安全 


由 于 数据 泄露 事件 频繁 发 生 ， 以 及 由 此 产生 的 试图 减少 泄密 的 规定 ( 见 第 15 章 ) ， 数 据 库 的 安全 和 保护 越 来 越 多 地 受到 各 
个 企业 的 关注 ， 得 到 的 预算 也 越 来 越 多 。 但 是 ， 数 据 库 安全 仍然 需要 我 们 花费 更 多 的 精力 和 努力 。 据 2005 年 Forrester 
Research 的 报告 ，75% 的 企业 没有 DBMS 安 全 计划 。 


14.1 数据 泄露 


随 着 各 种 数据 泄露 丑闻 的 曝光 ， 数 据 泄 露 持续 占据 着 商业 和 IT 新 闻 的 头条 。 最 近 的 泄露 事件 来 自 Epsilon ， 一 个 电子 邮件 莒 
销 公司 ， 每 年 发 送 数 十 亿 的 电子 邮件 。 该 事件 涉及 众多 知名 品牌 的 客户 的 电子 邮件 曝光 ， 包 括 RitzCarlton 和 Marriott 奖 励 计 
划 ， 银 行 如 Citibank 和 Capital One， 以 及 其 他 公司 如 Kroger 和 Walgreens。 


这 个 问题 有 多 糟糕 ?隐私 权 信息 交流 中 心 (www.privacyrights.org/data-breach) 跟踪 报道 了 每 一 次 数据 泄露 。 根 据 其 研 
究 ，2005 年 1 月 10 日 到 2012 年 初 之 间 超 过 5.444Z 条 记录 外 泄 ， 近 3000 个 单独 的 数据 泄露 事件 。 


能 否 估 计 那 些 丢 失 数 据 的 价值 ? 可 以 试 试 。 


经 历 了 数据 泄露 的 Forrester Research 关 于 公司 的 研究 得 出 的 结论 是 : 平均 每 条 由 于 安全 泄露 而 丢失 的 记录 的 花费 在 
90~305 美 元 。 但 得 出 精确 的 数字 可 能 会 很 困难 ， 因 为 存在 额外 的 、 情 有 可 原 情况 下 的 数据 泄露 。 成 本 因素 包括 法 律 费用 开支 、 
呼叫 中 心 、 失 去 的 员工 生产 力 、 监 管 罚 款 、 客 户 损失 、 股 票 损失 、 负 面 影响 的 模糊 成 本 等 。 


平均 每 条 由 于 安全 泄露 而 丢失 的 记录 的 花费 在 公司 90~305 美 元 之 间 。 


另 一 个 研究 小 组 (Ponemon Institute) 每 年 进行 一 次 数据 泄露 的 研究 。 根 据 其 第 6 年 度 美国 数据 泄露 成 本 的 研究 ，2010 年 
数据 的 泄露 成 本 上 升 至 每 条 记录 214 美 元 。 相 比 2006 年 的 报告 ， 即 客户 记录 丢失 的 平均 费用 为 182 美 元 ， 又 有 了 显著 的 增加 。 


如 果 还 在 怀疑 ， 可 以 使 用 Darwin Professional Underwriters，lnc .提供 的 免费 的 基于 Web 的 数据 丢失 计算 器 (www.tech- 
404.com/calculator.html) 进行 计算 。 


很 明显 的 结论 是 ， 数 据 泄漏 很 昂贵 ， 最 低 每 条 纪录 90 美 元 。 考 虑 一 个 典型 的 数据 泄露 案例 。2008 年 2 月 27 日 ，Health Net 
Federal Services 报 道 ，11 个 州 成 干 上 万 的 医生 将 自己 的 个 人 信息 (包括 社会 安全 号 码 ) 在 公司 网 站 上 公开 发 布 。 据 隐私 权 信息 
交流 中 心 的 统计 ， 涉 及 的 总 人 数 为 103000。 那 么 成 本 是 多 少 ? 最 低 成 本 为 930 万 美元 ， 最 高 成 本 可 超过 3140 万 美元 。Ponemon 
估计 ， 成 本 介 于 二 者 之 间 ， 费 用 从 1870 万 美元 到 2200 万 美元 不 等 。 


另外 一 个 有 趣 的 数据 来 自 2011 年 数据 泄露 调查 报告 ，Verizon 的 风险 管理 团队 与 美国 特勤 局 合作 对 荷兰 高 科技 犯罪 单位 进行 
了 一 项 研究 。 根 据 这 份 报告 ，76% 的 数据 泄露 是 因为 服务 器 被 攻破 。 此 外 ， 数 据 库 服 务 器 产生 了 绝 大 多 数 的 数据 泄露 。 


所 以 数据 泄露 的 成 本 是 相当 高 的 。 数 据 库 服务 器 是 黑客 喜欢 攻击 的 目标 。 因 此 ， 前 期 花 一 些 时 间 和 金钱 来 更 好 地 保护 数据 库 
系统 中 的 数据 是 有 道理 的 。 


14.2 ”数据 库 安全 基础 


DBMS 供 应 商 保护 数据 库 访 问 所 采取 的 基本 安全 和 授权 办 法 是 ， 所 有 的 数据 库 资 源 都 由 DBMS 控 制 。 不 得 以 任何 理由 给 任何 
用 户 授予 默认 权限 。 因 此 ， 如 果 一 个 用 户 能 够 执行 DBMS 的 任何 操作 或 功能 ， 其 必须 满足 下 列 条 件 之 一 : 


. 该 用 户 已 被 授予 执行 该 功能 或 操作 的 权限 ; 
. 或 这 种 操作 或 功能 已 经 授予 所 有 用 户 。 
所 有 的 数据 库 资 源 都 由 DBMS 控 制 。 


使 用 DBMS 的 安全 功能 ，DBA 可 以 设置 这 样 的 环境 : 只 允许 特定 用 户 或 特定 的 应 用 程序 对 数据 库 内 的 某 些 数据 执行 某 些 操 
作 。 根 据 企 业内 每 个 用 户 的 职责 来 确定 数据 库 访 问 的 授权 等 级 。 例 如 ， 只 有 总 账 程序 员 、 批 处 理 作 业 和 程序 可 以 访问 和 修改 总 账 


分 类 数据 库 。 可 以 检查 每 种 信息 的 访问 ， 对 于 不 同 数据 库 中 的 对 象 ， 不 同 的 用 户 应 该 有 不 同 的 访问 权限 。 


有 效 地 管理 数据 库 安 全 产生 运营 挑战 ， 因 为 建立 和 管理 数据 库 授权 需要 技术 专长 和 较 高 的 权限 。 数 据 库 安全 的 许多 方面 需要 
不 同 的 实用 程序 、 系 统 程序 和 命令 来 实现 。 当 用 户 需要 访问 分 布 在 不 同 物理 位 置 的 多 台 服 务 器 上 的 多 个 数据 库 时 ， 数 据 库 的 安全 


管理 就 会 变 得 相当 复杂 。 必 须 为 每 个 数据 库 重 复 所 有 的 命令 ， 且 没有 中 央 人 存储 库 可 同时 方便 修改 和 删除 多 个 数据 库 用 户 的 安全 设 
置 。 


虽然 DBA 通 常 负责 管理 数据 库 的 安全 ， 一 些 企业 将 这 个 任务 转移 到 一 个 单独 的 安全 管理 部 门 ， 它 控制 着 公司 所 有 的 IT 安全 。 


然而 ， 即 使 安全 管理 在 许多 公司 是 一 个 独立 实体 ， 数 据 库 的 安全 仍 由 DBA 组 处 理 ， 因 为 数据 库 安 全 的 管理 因 典 型 的 IT 授权 方案 而 
有 所 不 同 。 


当 安 全 管理 组 负责 处 理 安 全 政策 时 ， 这 个 组 通常 依赖 第 三 方 安全 软件 ， 如 IBM 的 RACF 或 Computer Associates 公 司 的 ACF2 


和 Top Secret。 这 些 产 品 都 将 安全 功能 实现 了 自动 化 ， 不 要 求 管理 员 拥 有 较 高 的 权限 来 管理 安全 政策 。 但 是 ， 大 多 数 这 些 安全 


管理 产品 只 在 主机 上 运行 。 此 外 ， 大 多 数 IT 安 全 部 门人 员 不 足 ， 缺 乏 DBMS 数 据 库 安全 管理 所 需 的 专业 知识 。 授 予 未 经 训练 的 安 
全 人 员 权 限 来 管理 数据 库 的 安全 ， 可 能 会 导 


能 会 导致 数据 库 服务 意外 中 断 或 性 能 问题 。 所 以 ，DBA 必 须 管 理 数据 库 安全 ， 并 作为 自己 
工作 的 一 部 分 。 


DBA 必 须 管 理 数据 库 安 全 ， 并 作为 自己 工作 的 一 部 分 。 
上 升 到 一 个 较 高 的 水 平 ， 数 据 库 安全 可 以 归结 为 回答 以 下 四 个 问题 : 
- 是 谁 ? (验证 ) 
- 谁 可 以 做 到 这 一 点 ? (授权 ) 
谁 可 以 看 到 它 ? (加 密 ) 
谁 做 过 ? (审计 ) 
强大 的 身份 验证 是 任何 安全 实施 计划 的 基础 。 没 有 它 ， 控 制 授权 和 跟踪 使 用 是 不 可 能 的 。 每 个 DBMS 用 户 必须 先 登录 ， 才 能 


使 用 数据 库 的 各 种 资源 。 登 录 名 有 时 也 称 为 账户 或 用 户 ID。 登 录 时 有 一 个 与 用 户 名 相关 联 的 密码 ， 只 有 那些 知道 密码 的 人 才 可 


以 使 用 该 登录 ID。 有 些 DBM S 使 用 操作 系统 登录 ID 和 密码 作为 DBM 的 登录 ID 和 密码 ， 有 些 则 为 数据 库 访 问 和 安全 性 ， 专 门 创 
建 了 人 额外 的 登录 ID 和 密码 。 


强大 的 身份 验证 是 任何 安全 实施 计划 的 基础 。 


当 DBMS 控 制 登录 时 ，DBA 需 要 提供 登录 创建 时 的 某 些 信息 。 通 常 不 是 实际 的 登录 名 或 用 户 ID。 必 须 提 供 以 下 信息 : 


密码: 用 户 必 须 提 供与 新 的 登录 相关 联 的 关键 短语 、 单 词 或 字符 串 ， 才 允许 访问 数据 库 。 
" 默认 数据 库 : 登录 时 ， 用 户 最 初 链接 到 的 数据 库 的 名 称 。 


' 默认 语言 : 当 使 用 的 DBMS 支 持 多 种 语言 时 ， 分 配给 登录 的 默认 语言 。 
“名称: 与 登录 相关 的 用 户 全 名 。 


* 其 他 详细 资料 : 创建 登录 时 ， 用 户 的 其 他 详细 信息 : 


电子 邮件 地 址 、 电 话 号 码 、 办 公 地 点 、 工 作 单 位 等 〈 用 于 文档 记录 ， 
非常 有 用 ) 。 


应 定期 更 换 密码 ， 使 黑客 和 不 法 分 子 无 法 获得 访问 DBMSs 的 机 会 。 请 参阅 “密码 指南 ”了 解 创建 有 用 的 密码 的 技巧 。 作 为 一 


名 DBA， 你 可 能 会 决定 设置 自动 程序 (如 电子 邮件 通知 系统 ) ， 强 迫 用 户 大 约 每 隔 一 个 月 就 改变 他 们 的 登录 密码 。 不 改变 登录 
密码 的 用 户 可 能 会 禁用 ， 直 到 他 们 打 电 话 投诉 。 当 然 ， 这 增加 了 DBA 的 工作 量 ， 但 它 确实 提高 了 DBMSs 的 安全 。 


应 定期 更 换 密码 。 


当 一 个 DBMS 用 户 不 再 需要 访问 DBMS 或 离开 公司 时 ，DBA 应 该 尽快 从 系统 中 删除 该 用 户 的 登录 。 然 而 ， 这 可 能 会 是 一 项 复 
杂 的 任务 ， 如 果 该 用 户 目 前 正在 使 用 一 个 数据 库 ， 或 者 如 果 用 户 拥有 任何 的 数据 库 对 象 ， 这 个 登录 都 不 能 丢弃 。 


出 于 这 个 原因 ， 将 可 以 创建 数据 库 对 象 的 数据 库 用 户 限制 为 DBA (特别 是 在 生产 环境 中 ) 是 非常 明智 的 。 
将 可 以 创建 数据 库 对 象 的 数据 库 用 户 限 制 为 DBA。 


为 了 取代 删除 登录 ，DBMS 可 以 提供 一 个 选项 来 锁定 登录 。 锁 定 登 录 可 以 禁止 用 户 访问 DBMS， 但 实际 上 并 没有 将 登录 从 系 
统 中 删除 。 登 录 可 以 随时 解锁 ， 从 而 实现 对 服务 器 的 访问 。 如 果 只 是 想 茜 止 访问 ， 即 对 于 那些 最 近 没有 改变 登录 密码 的 用 户 ， 这 
样 一 个 过 程 是 非常 有 用 的 。 
记 住 删除 的 登录 ， 如 果 再 次 需要 ， 必 须 重新 创建 。 出 于 这 个 原因 ， 根 据 经 验 法 则 ， 登 录 管 理 遵循 以 下 规则 : 
“ 锁定 可 能 需要 重新 激活 的 登录 。 
* 删除 将 不 再 需要 重新 激活 的 登录 。 
密码 指南 


作为 一 名 DBA， 你 负责 确保 DBMS 和 授权 用 户 的 数据 访问 。 保 证 正确 使 用 DBMS 的 方法 之 一 是 开发 和 推广 创建 有 用 的 密码 提 
示 。 难 以 猜测 的 密码 才 是 有 用 的 、 正 确 的 密码 。 


如 果 密码 过 于 简单 或 涉及 使 用 密码 的 人 的 个 人 信息 ， 一 些 图 谋 不 机 的 人 可 能 会 猜 到 密码 ， 并 用 它 来 访问 数据 库 。 
创建 正确 的 密码 应 遵循 下 列 准则 : 

1. 避 免 密码 太 短 。 每 个 密码 应 该 至 少 包括 6 个 字符 ， 如 果 可 能 ， 可 以 更 长 。 

2. 每 个 密码 应 至 少 包括 一 个 字母 字符 和 一 个 数字 字符 的 组 合 。 使 用 其 他 允许 的 符号 会 使 密码 变 得 很 难 猜 。 

3. 避 免 密 码 是 一 个 完整 的 单词 (无论 用 户 的 母语 还 是 任何 外 语 ) 。 

4. 不 要 在 密码 中 座 入 个 人 数据 。 街 道 地址 、 社 会 安全 号 码 、 电 话 号 码 以 及 容易 被 猜 到 的 不 属于 密码 的 内 容 。 

5. 考 虑 它们 之 间 用 一 个 符号 或 数字 连接 两 个 不 相干 的 字 。 例 如 ，“toe3staf” 是 一 个 可 行 的 密码 。 


使 用 助 记 符 装置 ， 来 帮助 你 记 住 密码 。 例 如 ， 使 用 句子 “Moondance by Van Morrison is my favorite album ”来 记 住 你 的 密码 


E 


是 “mbvmimfa” (句子 中 每 个 单词 的 第 一 个 字母 ) 。 但 是 ， 不 要 使 句子 太 明显 。 例 如 ， 用 “My name is Craig S.Mullins” 中 


的 “mnicsnT” 当 密码 就 不 是 一 个 好 主意 ， 因 为 它 很 容易 猜 到 。 


其 他 常见 的 弱 密 码 原 型 包括 运动 和 体育 界 名 人 (de “ChiBulls99” 3 “TigetWoods” ) 、 调 皮 的 话 (骂人 的 话 /解剖 学 ) 以 及 
家 庭 成 员 的 名 字 。 总 之 ， 如 果 你 认为 它 可 以 很 容易 猜 到 ， 就 避免 使 用 。 


作为 一 名 DBA， 应 该 与 企业 的 安全 管理 团队 一 起 努力 创建 一 些 如 以 上 准则 的 指南 ， 并 分 发 给 数据 库 用 户 。 


有 些 DBMS 对 登录 名 和 密码 提供 额外 的 控制 和 参数 。 例 如 ， 某 些 DBM 9 为 密码 提供 配置 文件 参数 ， 用 来 限制 : 


账户 锁定 前 登录 尝试 失败 的 次 数 。 

密码 有 效 的 天 数 ， 更 改过 期 密码 的 宽 限 期 。 

” 当 密 码 过 期 时 ， 账 户 可 以 保持 锁定 的 天 数 。 

:密码 的 可 重用 性 〈 密 码 可 重复 使 用 的 天 数 ， 密 码 可 重复 使 用 的 最 大 次 数 ) 。 
当 这 种 控制 可 用 时 ， 提 供 登 录 账 户 时 一 定 要 使 用 它们 ， 来 更 好 地 保障 DBM 环境 。 


不 过 ,请 记 住 ， 每 个 DBMS 都 是 不 同 的 ， 可 能 没有 办 法 强制 用 户 定期 更 改 密码 。 如 果 密 码 从 来 没有 更 改过 ， 受 到 损害 的 可 能 
性 就 会 增加 。 如 果 数 据 库 能 够 强制 定期 进行 密码 更 改 ， 通 常 其 能 力 仅 限于 完全 执行 公司 的 密码 标准 ， 减 少 密码 被 猜 到 的 风险 。 这 
些 标 准 通常 包括 最 小 长 度 和 字母 要 求 。 大 多 数 DBMS 都 没有 提供 简单 的 界面 ， 供 终端 用 户 更 改 密码 使 用 。 如 果 用 户 的 账户 在 多 个 
服务 器 的 多 个 数据 库 ， 那 么 问题 更 加 复杂 。 


强制 执行 企业 密码 标准 。 


数据 库 用 户 


除了 访问 DBMS 必 需 的 登录 账户 ， 一 些 数据 库 系统 还 需要 额外 的 账户 来 访问 特定 的 数据 库 。 在 这 种 情况 下 ， 创 建 用 户 名 登录 
账户 ， 并 连接 到 用 户 所 需要 的 每 个 数据 库 。 如 图 14-1 所 示 ， 可 能 需要 以 下 账户 : 


SUID 


UID m — 


图 14-1 DBMS 和 数据 库 登 录 


. 登录 账户 (有 时 称 为 账号 ) 用 于 访问 DBMS 或 数据 库 服务 器 。 出 于 这 个 原因 ， 它 有 时 也 称 为 服务 器 用 户 ID 或 SUID。 


用 户 名 (有 时 也 称 为 数据 库 ID) 。 用 户 名 与 登录 账户 相关 联 。 一 些 DBMS 实 施 需要 用 户 创建 数据 库 用 户 名 来 访问 每 个 数据 


通过 配置 允许 用 户 作 为 GUEST 访问 数据 库 的 特殊 用 户 名 ，Guest 可 以 使 用 数据 库 。 数 据 库 添加 一 个 GUEST 用 户 使 得 任何 用 
此 特殊 用 户 名 登录 的 用 户 都 可 以 访问 数据 库 。 


14.3 ”授予 和 撤销 授权 


DBA 使 用 数据 控制 语言 (或 DCL) 控制 数据 库 的 安全 和 授权 。DCL 是 SQL 的 三 个 子 类 型 之 一 。 (另外 两 个 是 DDL 和 DML。 


) DCL 语 句 用 于 控制 哪些 用 户 可 以 访问 哪些 目标 和 命令 。 这 些 语句 用 于 制定 数据 库 安 全 。DCL 语 句 包含 两 种 基本 类 型 : 


- GRANT， 向 数据 库 用 户 授 予 权限 。 
REVOKE， 删 除数 据 库 用 户 的 权限 。 
DCL 语 和 句 包括 两 种 基本 类 型 : GRANT 和 REVOKE。 


发 出 GRANT 语句 时 伴随 两 个 列表 : 分 配给 用 户 列 表 的 权限 列表 。 使 用 GRANT 语句 的 用 户 必 须 是 数据 库 对 象 的 所 有 者 ， 且 已 
授予 高 级 别 的 组 权限 ， 或 授予 权限 时 给 予 WITH GRANT OPTION, 


WITH GRANT OPTION 人 允许 用 户 将 授予 权限 的 权限 给 其 他 人 。 一 般 情况 下 ， 使 用 这 一 字句 依赖 是 否 安 装 集中 或 分 散 管理 权 
限 。 


:分散 管理 一 般 更 容易 建立 ， 但 相对 更 难以 控制 。 随 着 越 来 越 多 的 用 户 获得 授予 权限 的 权限 ， 权 限 的 范围 加 宽 ， 变 得 难以 控 
制 。 


- 集中 管理 一 般 比 较 容 易 管理 ， 但 作为 环境 内 权限 唯一 的 仲裁 者 ， 集 中 管理 员 的 负担 很 重 。 


避免 从 应 用 程序 发 出 GRANT 和 REVOKE 语 句 。 理 想 的 情况 下 ， 由 了 解 企 业 安全 需要 的 个 人 (通常 是 DBA) 授予 数据 库 权 
限 。 另 外 ， 授 予 数 据 库 权 限 的 应 用 程序 ， 必 须 由 有 权 向 应 用 程序 发 出 CRANT 和 REVOKE 代 码 的 用 户 执行 。 这 可 能 是 数据 库 安全 
基础 设施 的 一 个 漏洞 。 


某 些 DBMS 提 供 额 外 的 功能 ， 授 予 或 禁止 数据 库 权 限 。 例 如 ，Microsoft SQL Server 包 括 DENY 语 句 来 明确 否认 特定 用 户 的 
权限 。 


14.3.1 权限 类 型 
数据 库 用 户 可 以 授予 和 撤销 许多 不 同类 型 的 权限 。 每 个 DBMS 都 提供 了 一 些 基本 类 型 的 权限 ， 如 访问 数据 、 创 建 数据 库 对 象 
和 执行 系统 功能 。 每 个 DBM S 还 提供 其 他 类 型 的 权限 ， 这 取决 于 它 所 支持 的 功能 。 
通常 现代 的 DBMS 都 提供 以 下 类 型 的 权限 : 
“ 表 : 控制 可 以 访问 和 修改 表 的 数据 的 人 。 
o 数据 库 对 象 : 控制 可 以 创建 新 的 数据 库 对 象 ， 并 删除 现 有 数据 库 对 象 的 人 。 
* 系统: 控制 可 以 执行 茶 种 系统 范围 活动 的 人 。 
程序; 控制 可 以 创建 、 修 改 和 使 用 数据 库 程序 的 人 。 


+ 存储 过 程 : 控制 可 以 执行 特定 功能 和 存储 过 程 的 人 。 
授予 表 权 限 


授予 表 权 限 ， 使 用 户 能 够 访问 表 、 视 图 以 及 表 和 视图 内 的 列 。 可 以 授予 表 和 视图 以 下 权限 : 
- SELECT: 让 用 户 从 该 表 / 视 图 选择 。 


INSERT: 使 用 户 能 够 插入 行 到 这 个 表 / 视 图 中 。 


‘UPDATE: 允许 用 户 更 新 此 表 / 视 图 。 

- DELETE: 使 用 户 能 够 从 这 个 表 / 视 图 中 删除 行 。 

ALL: 让 用 户 使 用 该 表 / 视 图 选择 、 插 入 、 更 新 和 删除 。 
例如 ， 为 了 使 user7 从 titles 表 中 删除 行 ， 可 以 发 出 下 面 的 语句 : 
GRANT DELETE on Titles to user7; 


有 些 表 的 权限 可 以 指定 在 列 级 。 当 必须 允许 某 些 用 户 修改 一 个 表 的 特定 列 而 不 是 其 他 列 时 ， 这 样 做 是 可 取 的 。 可 以 授予 
SELECT 和 UPDATE 权 限 给 特定 列 。 例 如 ， 为 了 使 user7 只 更 新 titles 表 中 的 au_idq 列 ， 可 以 发 出 下 面 的 语句 : 


GRANT UPDATE on Titles (au_id) to user7; 


通常 情况 下 ，DBA 为 了 开发 需要 ， 在 测试 环境 下 将 表 权 限 授予 程序 员 。 此 外 ， 程 序 员 和 终端 用 户 可 能 要 求 某 些 任务 的 生产 
表 的 表 权 限 。 然 而 ， 大 多 数 是 生产 访问 应 使 用 程序 和 存储 过 程 权限 进行 控制 ， 而 不 是 直接 的 表 权 限 。 


授予 数据 库 对 象 权 限 


数据 库 对 象 权 限 控制 哪些 用 户 有 权限 创建 数据 库 结构 。 可 授予 的 实际 权限 依赖 DBMS 和 | 数据库 支 持 的 对 象 类 型 。 一 般 来 
说 ，DBMS 为 每 种 类 型 的 数据 库 对 象 提供 授予 GRANT 权 限 的 选项 ， 包 括 数据 库 、 表 空间 、 表 、 索 引 、 触 发 器 、 默 认 值 和 用 户 自 
定义 的 数据 类 型 。 


例如 ， 要 使 ser5 和 user9 能 够 创建 表 和 索引 ， 可 以 发 出 下 面 的 语句 : 


GRANT CREATE table, 
CREATE index 
TO user5 ， 
USer9 


通常 将 创建 数据 库 对 象 的 权限 留 给 DBA。 如 果 这 些 权限 授予 他 人 ， 现 有 数据 库 对 象 的 数量 就 难以 控制 。 此 外 ， 真 正 使 用 的 
是 哪些 数据 库 对 象 、 哪 些 创建 了 却 没有 使 用 将 变 得 很 难 跟踪 。 出 于 这 些 原 因 ，DBA 应 该 自己 保留 权限 ，SA 或 非常 熟练 的 开发 人 
员 除 外 。 


通常 创建 数据 库 对 象 的 权限 留 给 DBA 


受 予 系统 权限 


系统 权限 控制 哪些 用 户 可 以 使 用 特定 的 DBM 功能， 并 执行 特定 的 DBMS 命 令 。 可 用 的 系统 权限 会 因 DBMS 不 同 而 有 所 不 
同 ， 但 可 能 包括 归档 数据 库 日 志 、 关 闭 并 重启 数据 库 服务 器 、 开 始 追 踪 监 测 、 管 理 存储 和 管理 数据 库 绥 存 的 权限 。 


授予 系统 权限 不 能 在 数据 库 级 别 ， 而 是 跨 DBMS 的 系统 范围 级 别 。 例 如 ， 为 了 使 user6 启 动 性 能 追踪 ， 可 以 发 出 下 面 的 语 
句 


CRANT TRACE 
TO user6; 


授予 系统 权限 不 能 在 数据 库 级 别 。 


授予 系统 权限 应 小 心 ， 且 通常 是 DBA 和 SA 操作 。 
授予 过 程 和 程序 权限 


授予 EXECUTE 权 限 允 许 用 户 执 行程 序 或 存储 过 程 。 例 如 ， 使 user1 和 user9 能 够 执行 名 为 proc1 的 存储 过 程 ， 可 以 发 出 下 面 
的 语句 : 


GRANT EXECUTE on procl 
TO userl, user9; 


受 予 用 户 某 些 程序 的 权限 ， 比 授予 单个 表 和 人 列 的 权限 更 容易 控制 。 程 序 中 的 程序 逻辑 控制 哪些 特定 的 表 和 列 可 以 修改 。 此 
外 ， 如 果 只 能 通过 编程 的 方式 来 修改 生产 数据 ，DBA 可 以 更 好 地 维护 它 的 完整 性 。 


14.3.2 授予 PUBLIC 
作为 一 种 授予 数据 库 用 户 的 访问 权限 ，DBA 可 以 选择 授予 一 种 特殊 的 权限 PUBLIC。 授 予 PUBLIC 权 限 ，DBMS 人 允许 任何 登录 
到 DBMS 的 人 都 拥有 这 种 特殊 的 权限 。PUBLIC 权 限 不 能 授予 WITH GRANT OPTION， 因 为 每 个 人 都 是 PUBLIC 的 一 部 分 。 
例如 ， 授 予 每 个 人 从 titles 表 中 删除 行 的 权利 ， 可 以 发 出 下 面 的 语句 : 


GRANT DELETE on titles to PUBLIC; 


Rebs SARA LF. SEFAPUBLICMIRARITFS ARBITRATE NSA, BALA ST RAIS 
容易 。 但 是 ，DBA 应 该 谨慎 授予 PUBLIC 权 限 。 


i 


DBA 应 该 谨慎 授予 PUBLIC 权 限 。 


每 当 授予 PUBLIC 权 限时 ，DBA 就 失去 对 那个 数据 库 对 象 或 资源 的 控制 权 ， 任 何人 都 可 以 访问 或 使 用 GRANT 语句 指定 的 对 象 
或 资源 。 不 可 避免 的 是 ， 用 户 会 滥用 PUBLIC 资 源 ， 想 再 次 获得 资源 的 控制 权 将 相当 困难 。 


为 少数 数据 库 对 象 和 资源 预 留 的 PUBLIC 权 限 ， 大 家 都 可 以 使 用 。 另 外 。 如 果 还 有 其 他 安全 机 制 ，PUBLIC 权 限 可 以 成 为 一 种 
捷径 。 例 如 ， 对 于 事务 处 理 器 运行 的 事务 ， 以 及 使 用 事务 处 理 器 的 安全 设施 来 控制 访问 的 事务 ， 可 以 授予 PUBLIC 的 程序 权限 。 


PUBLIC 权 限 和 系统 目录 


DBA 面 临 的 一 个 共同 难题 是 ， 是 否 授予 系统 目录 表 PUBLIC 的 访问 权限 。 一 方面 ， 系 统 目录 中 包含 的 元 数据 是 非常 有 用 的 信 
息 ， 大 多 数 DBA、 开 发 人 员 和 分 析 师 需要 它们 来 建立 和 维护 访问 生产 数据 库 的 应 用 程序 。 另 一 方面 ， 系 统 目录 经 常 包含 可 以 被 
黑客 所 利用 的 敏感 信息 。 例 如 ， 可 以 查询 包含 授权 细节 的 系统 目录 来 了 解 谁 访问 过 哪个 表 。 这 些 表 通 常 也 包含 用 户 ID 和 数据 库 
的 登录 信息 。 此 外 ， 能 够 查询 系统 目录 公开 的 、 在 系统 中 创建 的 所 有 表 的 名 称 ， 使 其 更 容易 被 黑客 用 来 访问 数据 (或 试图 SQL 注 
入 攻击 ) 。 


底线 是 ， 应 该 避免 授予 公众 访问 系统 目录 表 的 权限 。 


不 要 授予 系统 目录 表 PUBLIC 的 访问 权限 。 


14.3.3 “撤销 权限 


REVOKE 语 句 用 于 删除 以 前 授予 的 权限 。REVOKE 的 语法 是 GRANT 语法 的 另 一 方面 。 此 外 ， 当 删除 数据 库 对 象 时 ， 权 限 由 
DBMS 自 动 撤销 。 

例如 ， 撤 销 user7 更 新 titles 表 au-id 列 的 权限 : 

REVOKE UPDATE on titles (au_id) from user7; 

撤销 PUBLIC 权 限 ， 将 不 删除 在 单独 GRANT 语 句 中 授予 权限 的 任何 用 户 的 权限 。 


级 联 REVOKE 


当 撤销 某 些 权限 时 ，DBMS 必 须根 据 被 撤销 的 权限 决定 是 否 需 要 额外 的 撤销 。 当 一 个 撤销 导致 DBM 撤销 其 他 相关 的 权限 
时 ， 称 为 级 联 REVOKE。 考 虑 如 图 14-2 所 示 的 权限 层次 结构 。joe 已 授予 为 他 人 授予 权限 (如 X) 的 权限 。 他 用 GRANT 选项 为 
Pete 和 Phil 授 予 X。Pete 将 X 转 授予 给 Bruce。Joe 也 将 Xx 授予 给 Don， 但 没有 使 用 GRANT 选 项 。 


Joe 


GRANT x to Pete WGO 
Phil | | Don | GRANT x to Phil WGO 
GRANT x to Don 


Pete 


Bruce 


现在 通过 概述 如 果 撤 销 Joe 的 X 权 限 会 发 生 什么 ， 我 们 来 调查 级 联 REVOKE 的 影响 。 在 这 种 情况 下 ， 不 仅 Joe 将 不 再 拥有 X 权 
限 ， 而 且 DBMS 也 将 删除 Pete、Phil 和 Don 的 权限 。 此 外 ， 由 于 Phil 的 X 权 限 被 撤销 ， 撤 销 也 将 级 联 到 Bruce。 


图 14-2 REVOKE 


要 将 级 联 REVOKE 的 影响 降 到 最 低 ， 应 避免 使 用 WITH GRANT OPTION 授 予 权 限 。 可 以 授予 后 续 权 限 的 用 户 越 少 ， 管 理 可 
行 的 DBM 安全 基础 设施 就 越 容易 。 


有 些 DBMS 产 品 提供 的 REVOKE 语 句 选 项 ， 使 撤销 权限 时 不 会 发 生 级 联 。 
Chronology 和 Revoke 

GRANT 或 REVOKE 语 句 的 计时 可 能 与 其 影响 有 关 。 例 如 ， 某 些 DBM S 通 过 发 出 下 面 的 语句 ， 可 以 给 除 特定 用 户 以 外 的 所 有 
用 户 授予 权限 : 


GRANT DELETE on titles to public; 
COMMIT; 
REVOKE DELETE on titles from userx; 


GRANT 或 REVOKE 语 名 的 计时 可 能 与 其 影响 有 关 。 


第 一 条 语句 授予 所 有 人 删除 titles 表 的 数据 的 权限 。 在 公众 的 GRANT 后 发 出 REVOKE 语 句 ， 个 别 用 户 将 禁止 从 该 表 中 删除 数 
据 。 一 些 DBMS (如 DB2) 不 允许 这 种 排除 ， 因 为 PUBLIC 权 限 将 重 写 任何 撤销 ; 而 另 一 些 DBMS (如 Microsoft SQL Server) 
则 人 允许 这 样 的 排除 。 


为 了 受 善 管理 数据 库 对 象 和 资源 的 权限 ，DBA 需 要 确切 地 了 解 每 个 DBM s 是 如 何 进行 GRANT 和 REVOKE 工 作 的 。 


14.3.4 ”基于 标签 的 访问 控制 


由 于 数据 库 系 统 和 应 用 程序 越 来 越 复 杂 ， 数 据 的 低级 别 访问 控制 的 需要 变 得 更 加 重要 。 越 来 越 多 的 DBMS 提 供 基于 标签 的 访 
间 控 制 (LBAC) ， 以 确保 每 一 块 数据 是 安全 的 ， 只 有 经 过 授权 的 用 户 才 可 以 执行 授权 的 功能 。 有 了 LBAC， 便 有 可 能 支持 那些 需 
要 细 粒 度 安全 计划 的 应 用 程序 。 可 以 通过 设置 LBAC 指 定 谁 可 以 读 取 和 修改 单个 行 和 /或 列 中 的 数据 。 


LBAC 提 供 了 更 细 粒 度 的 安全 计划 ， 指 定 谁 可 以 读 取 和 修改 单个 行 和 /或 列 中 的 数据 。 


例如 ， 要 对 权限 进行 设置 ， 使 员工 可 以 看 到 自己 的 数据 ， 但 不 是 别人 的 数据 。 或 者 你 的 授权 需求 可 能 是 ， 每 个 员工 的 直接 经 
理 能 够 通过 组 织 结构 图 看 到 该 员工 的 工资 情况 ， 以 及 受 他 管理 的 所 有 员工 的 所 有 数据 。 建 立 这 样 的 安全 方案 ， 没 有 LBAC 几 乎 是 
不 可 能 的 。 


管理 员 必须 通过 创建 安全 标签 组 件 (数据 库 对 象 用 来 决定 用 户 是 否 可 以 访问 数据 块 的 条 件 ) 来 配置 LBAC 系 统 。 安 全 策略 ， 
由 一 个 或 多 个 安全 标签 组 件 组 成 ， 用 来 描述 哪些 人 可 以 访问 哪些 数据 的 标准 。 安 全 管理 员 通 过 创建 由 安全 标签 组 件 组 成 的 安全 标 
签 ， 定义 策略 。 


安全 标签 一 旦 创建 ， 就 可 以 与 表 的 行 和 列 相关 联 来 保护 数据 。 管 理 员 通过 授予 安全 标签 来 允许 用 户 访问 受 保护 的 数据 。 当 用 
户 试 图 访问 受 保护 的 数据 时 ， 该 用 户 的 安全 标签 与 保护 数据 的 安全 标签 进行 比较 。 保 护 标签 将 阻止 其 中 一 些 安全 标签 。 


任何 个 人 用 户 可 以 持 有 多 个 安全 政策 的 安全 标签 。 然 而 ， 对 于 任何 给 定 的 安全 政策 ， 用 户 最 多 只 可 以 将 一 个 标签 用 于 读 取 ， 
而 一 个 标签 用 于 写 入 。 安 全 管理 员 也 可 以 给 用 户 授予 夫 免 。 座 免 允许 用 户 访问 受 保护 的 数据 。 安 全 标签 和 座 免 称 为 LBAC 凭 证。 


当 LBAC 凭 证 不 允许 访问 时 ， 任 何 试图 访问 受 保护 列 的 访问 都 将 失败 。 如 果 用 户 试图 读 取 不 被 LBAC 和 凭证 允许 的 受 保护 的 
行 ，DBMS 只 是 简单 地 当 这 些 行 不 存在 。 即 使 是 聚合 函数 ， 如 COUNT (*) ， 当 LBAC 凭 证 不 允许 读 取 访 问 时 ， 也 将 忽略 行 。 这 
很 重要 ， 因 为 有 时 即使 知道 有 数据 存在 (不 能 够 访问 ) ， 也 必须 保护 它们 。 


要 使 用 LBAC， 需 要 添加 一 个 特别 命名 的 列 作为 安全 标签 。 安 全 标签 列 与 管理 员 设 置 的 多 级 安全 等 级 相 匹 配 。 例 如 ， 要 用 颜 
色 设 置 各 层次 结构 ， 如 图 14-3 所 示 。 当 然 ， 层 次 不 需要 这 么 复杂 ， 可 以 选择 简单 的 ， 如 TOP SECRET、SECRET 和 
UNCLASSIFIED, 


RAINBOW 


atue | omeen | vioLET | orance | | veuow | BABY BLUE 


NAVY 
图 14-3 LBAC 安 全 等 级 示例 


查阅 DBMS 文 档 了 解 在 哪里 以 及 如 何 建 立 这 个 层次 。 例 如 ， 对 于 z/OS 的 DB2， 层 次 结构 建立 在 安全 软件 上 ， 如 RACF。 例 子 
中 最 上 面 的 层次 (图 14-3) : RAINBOW 安 全 标签 包含 一 切 ， 所 有 的 颜色 都 包含 在 彩虹 中 。 层 次 的 中 间 代表 可 创建 的 其 他 安全 
组 。 在 这 种 情况 下 ， 有 COOL、WARM 和 PASTEL。COOL 下 是 各 种 冷色 调 : BLUE、GREEN 和 VIOLET。 甚 至 可 以 用 各 种 色调 的 
BLUE 对 整个 层次 进一步 分 类 ， 这 样 的 层次 为 表 中 的 数据 分 配 不 同 的 安全 级 别提 供 了 极 大 的 灵活 性 ， 从 而 可 以 正确 保护 数据 不 会 
受到 未 经 授权 的 用 户 的 访问 。 


为 表 分 配 一 个 安全 标签 列 ， 在 层次 结构 中 为 该 列 填充 合适 的 说 明 ， 来 控制 单个 用 户 是 否 可 以 访问 该 特定 的 行 。 因 此 ， 为 某 行 
分 配 RAINBOW 的 安全 标签 ， 使 任何 人 都 可 以 访问 该 行 的 数据 ， 而 为 其 分 配 NAVY 会 正好 相反 。 有 权 访 问 RAINBOW 的 用 户 可 以 
访问 数据 ， 因 为 所 有 的 颜色 都 包含 在 彩虹 中 。BLUE 数 据 可 以 访问 与 BLUE 相关 的 任何 行 ， 或 蓝 色 的 任何 从 属 色调 (NAVY 和 
CYAN) 。 


分 配 一 个 安全 标签 ， 控 制 单个 用 户 是 否 可 以 访问 某 个 特定 的 行 。 


LBAC 提 供 了 非常 强大 的 安全 设置 。 这 种 严格 的 安全 控制 在 政府 数据 库 中 很 常见 。 


14.3.5 ”安全 报告 
一 旦 授权 ，DBA 将 需要 对 用 户 持 有 的 权限 进行 监测 和 报告 。 数 据 库 安全 在 系统 目录 中 维护 。DBA 可 以 使 用 SQL 从 适当 的 系统 
目录 表 中 检索 所 需要 的 信息 。 另 外 ， 某 些 DBMS 提 供 视 图 和 系统 存储 过 程 ， 简 化 了 数据 库 安全 的 检索 。 


但 是 ， 为 长 远 考 虑 ， 一 定 要 充分 保护 系统 目录 的 安全 ， 尤 其 是 生产 系统 的 系统 目录 。 只 有 DBA、SA 和 安全 管理 员 需 要 访问 
存储 在 系统 目录 中 的 数据 库 安全 性 信息 。 


一 定 要 充分 保护 系统 目录 的 安全 。 


用 户 的 安全 要 求 和 期 望 往往 随时 间 变 化 。 随 着 新 的 应 用 程序 的 加 入 和 业务 需求 的 变化 ， 数 据 库 的 安全 也 需要 变化 。 应 定期 进 
行 安全 审查 ， 确 保 数据 库 安全 持续 符合 当前 用 户 的 需求 。 审 查 可 以 使 用 系统 目录 表 报告 中 的 信息 。 


14.4 授权 角色 和 组 


除了 授予 个 人 用 户 权限 ，DBMS 可 以 为 用 户 分 配 : 
“ 特定 的 角色 权限 ， 然 后 将 其 授予 他 人 ; 
- 或 特定 内 置 组 权限 。 


当然 ， 这 个 术语 在 主要 的 DBM S 之 间 并 不 那么 严格 。 某 些 DBM S 将 角色 称 为 组 ， 将 组 称 为 角色 。 作 为 一 名 DBA， 应 该 明白 自 
己 管 理 的 每 个 DBMS 如 何 执行 角色 和 组 ， 这 些 功能 如 何 用 来 简化 数据 库 安全 管理 。 


14.4.1 角色 


DBA 可 以 创建 一 个 角色 ， 分 配 某 些 权限 给 这 个 角色 。 


一 旦 定义 ， 角 色 可 用 于 授予 用 户 一 个 或 多 个 预 分 配 权限 。 基 本 上 角色 是 权限 的 集合 。DBA 可 以 创建 一 个 角色 ,分 配 某 些 权 
限 给 这 个 角色 。 然 后 将 这 个 角色 分 配给 一 个 或 多 个 用 户 。 这 种 方式 可 以 简化 数据 库 的 安全 管理 。 例 如 ， 考 虑 下 面 的 语句 序列 : 

CREATE role MANAGER; 

COMMIT; 

GRANT select, insert, update, delete on employee to MANAGER; 

GRANT select, insert, update, delete on job_title to MANAGER; 

GRANT execute on payroll to MANAGER; 

COMMIT; 


GRANT MANAGER to user1; 
COMMIT; 


此 脚本 创建 了 一 个 新 的 名 为 “MANAGER” 的 角色 ， 在 某 些 表 和 程序 中 给 这 个 角色 授权 ， 然 后 将 这 个 MANAGER 角 色 分 配 
给 userl。 其 他 用 户 也 可 以 分 配 MANAGER 的 角色 ，DBA 不 需要 记得 逐一 发 出 GRANT 语句 ， 因 为 它们 已 经 分 配 了 MANAGER 角 
色 。 


14.4.2 组 
组 级 权限 与 角色 类 似 。 然 而 ,每 个 DBMS 提 供 的 内 置 组 都 不 能 改变 。 每 个 DBMS 以 不 同 的 方式 、 不 同 的 组 名 和 权限 来 实现 组 
级 数据 库 的 安全 。 但 是 ,不 同 的 DBMS 也 有 一 些 相似 之 处 。 以 下 几 种 组 在 主要 的 DBMS 中 很 常见 : 


. 系统 管理 员 。 有 时 简称 SA 或 SYSADM， 系 统管 理 员 组 在 DBMS 内 拥有 最 高 权限 。 被 授予 SA 级 别 权限 的 用 户 通常 可 以 执行 所 
有 的 数据 库 命令 ， 也 可 以 访问 所 有 的 数据 库 和 对 象 。 系 统管 理 员 通 常 负责 安装 DBMS ， 其 被 看 作 系统 资源 和 系统 目录 表 的 所 有 
者 。 


. 数据 库 管理 员 。 有 时 缩写 为 DBADM 或 DBA， 数 据 库 管理 员 组 拥有 特定 数据 库 的 所 有 权限 ， 还 可 以 访问 (但 不 能 修改 ) 该 
数据 库 中 表 的 数据 。 分 配 DBA 级 别 权 限 的 用 户 可 以 删除 和 更 改 数据 库 中 的 任何 对 象 ( 表 空 间 、 表 和 索引 ) 。 


“ 数据 库 维 护 。 有 时 简称 为 DBMAINT。 数 据 库 维护 组 拥有 维护 数据 库 对 象 ( 如 运行 实用 程序 及 发 出 命令 的 能 力 ) 的 特定 数 


据 库 的 权限 。 与 DBA 组 一 样 ， 授 予 DBMAINT 级 别 的 权限 是 在 数据 库 的 基础 上 进行 的 。 


ie 


安全 管理 员 。 安 全 管理 
审 


员 角 色 有 权 设置 跨 DBMS 授 予 和 撤销 数据 库 的 安全 。 安 全 管理 员 可 以 执行 数据 库 安 全 相关 的 任何 活 
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十 、 安 全 配置 ， 以 及 授予 和 撤销 。 安 全 管理 员 角 色 的 另 一 个 常见 名 是 SSO。 


. 操作 控制 。 有 时 也 称 为 OPER 或 YSOPR， 操 作 控 制 角色 有 权 执 行 操作 数据 库 的 任务 ， 如 备份 和 恢复 ， 或 终止 失控 的 任 


$z 


每 个 DBMS 提 供 的 内 置 组 都 不 能 改变 。 
限制 SA 用 户 的 数量 


企业 应 该 对 拥有 SA 角色 或 组 级 权限 的 用 户 数量 进行 控制 。 [1 有 SA 权限 的 用 户 有 很 大 的 权力 。 应 该 只 有 企业 DBA 和 系统 程序 
员 可 以 获得 这 个 级 别 的 权限 。 终 端 用 户 、 管 理 人 员 和 应 用 程序 开发 人 员 的 工作 并 不 需要 SA 权限 。 


有 SA 权限 的 用 户 有 很 大 的 权力 。 
组 级 安全 和 级 联 REVOKE 


根据 组 ， 一 些 已 分 配 组 级 权限 的 用 户 可 以 向 其 他 用 户 授予 权限 。 如 果 撤 销 用户 的 组 级 权限 ， 那 么 由 该 用 户 授予 的 所 有 权限 也 
将 撤销 。 这 与 因 WITH GRANT OPTION 而 发 生 的 级 联 REVOKE 类 似 。 


撤销 用 户 的 组 级 权限 前 ， 一 定 要 确定 级 联 REVOKE 的 影响 ， 并 准备 重新 申请 因 级 联 效应 而 要 删除 的 权限 。 


四 购买 第 三 方 应 用 程序 是 个 特别 令 人 烦恼 的 问题 。 许 多 这 样 的 应 用 程序 依赖 SA 权限 ， 因 为 这 很 容易 。 但 这 种 做 法 得 不 到 保障 。 


14.5 ”其 他 数据 库 安全 机 制 


现代 关系 DBM 产品 的 很 多 功能 都 可 以 帮助 确保 数据 安全 。 有 些 功能 不 是 主要 的 安全 功能 。 例 如 ， 视 图 和 存储 过 程 可 以 用 于 
安全 目的 ， 但 这 不 是 它们 的 主要 用 途 。 


14.5.1 ”安全 使 用 视图 


大 多 数 数 据 库 依 靠 DBMS 自 带 的 安全 性 来 保证 其 安全 。 但 是 ， 可 以 通过 创建 视图 来 保护 数据 ， 从 而 简化 数据 库 安全 。 


企业 已 经 部 署 了 一 个 雇员 表 ， 里 面 存 有 所 有 雇员 的 相关 信息 。 表 的 列 存 储 雇员 的 姓名 、 中 间 名 缩写 、 地 址 、 电 话 号 码 和 工资 
等 。 授 予 一 组 用 户 在 该 雇员 表 的 SELECT 权限 可 能 会 导致 安全 问题 。 虽 然 这 种 方式 可 以 维护 应 用 程序 的 安全 ， 个 人 信息 安全 却 得 
不 到 保障 ， 因 为 用 户 可 以 访问 其 他 人 的 个 人 信息 ， 包 括 资 深 员 工 的 工资 信息 。 


可 以 创建 一 个 视图 ， 省 略 雇员 表 的 敏感 信息 。 当 创建 了 不 含 敏感 列 的 视图 时 ， 可 以 授予 用 户 SELECT 视 图 的 权限 ， 并 能 够 访 
问 合适 的 员工 信息 。 例 如 : 


CREATE view emp_all 

AS 

SELECT first_name, last_name, middle_initial, 
street_address, state, zip_code 

FROM employee; 


可 以 创建 一 个 视图 ， 省 略 敏感 信息 。 


` 


这 个 简单 的 例子 说 明 视 图 只 指定 基 表 中 的 某 些 列 。 视 图 一 旦 创建 ， 将 授予 用 户 SELECT 视 图 的 权限 ， 其 只 能 检索 视图 中 指定 
的 信息 。 从 基 表 消除 列 以 创建 视图 称 为 纵向 限制 。 


当然 ， 敏 感 的 定义 因 企业 而 异 。 在 本 书 的 例子 中 ， 删 除了 工资 和 电话 信息 。 很 容易 理解 为 什么 工资 是 敏感 信息 ， 但 电话 号 码 
Ne? 如果 电话 号 码 是 敏感 信息 ， 雇 员 的 地 址 应 该 也 是 。 视 图 允许 你 轻松 地 为 你 的 企业 指定 必要 的 列 级 安全 。 


使 用 视图 的 纵向 限制 是 在 授予 表 权 限 的 同时 指定 列 的 蔡 代 方法 。 它 的 实现 和 管理 都 更 容易 。 


根据 数据 的 内 容 ， 视 图 也 可 用 来 提供 行 级 安全 性 。 这 就 是 所 谓 的 横向 限制 ， 通 过 为 视图 编写 适当 的 WHERE 子 句 来 实施 。 例 
如 : 


CREATE view emp_dept20 

AS 

SELECT first_name, last_name, middle_initial, 
street_address, state, zip_code 

FROM employee 

WHERE deptno = 20; 


当 用 户 从 视图 中 选择 时 ， 只 有 与 谓词 匹配 的 行 才 会 返回 。 此 视图 只 返回 那些 在 部 门 20 工 作 的 员工 。 如 果 用 户 要 修改 视图 的 
行 ， 但 已 经 指定 了 WITH CHECK OPTION, ， 谓 词 将 确保 值 不 会 更 新 或 插入 在 范围 外 。 此 外 ， 指 定 了 WITH CHECK OPTION ， 不 
匹配 谓词 的 行 不 能 使 用 视图 删除 。 


14.5.2 ”安全 使 用 存储 过 程 


存储 过 程 可 以 用 来 提供 额外 的 安全 级 别 。 无 论 基 表 上 实现 的 安全 性 如 何 ， 必 须 明 确 授予 或 撤销 执行 存储 过 程 的 权限 。 
必须 明确 授予 或 撤销 执行 存储 过 程 的 权限 。 


可 以 编写 存储 过 程 只 访问 行 级 和 /或 列 级 的 数据 子 集 。 然 后 执行 这 些 人 存储 过 程 的 权限 ， 可 以 授予 给 用 户 。 如 果 没 有 授予 基 表 
权限 ， 用 户 只 能 通过 执行 存储 过 程 来 访问 数据 ， 从 而 提供 必要 的 安全 。 


除了 提供 安全 级 别 ， 如 果 人 存储 中 的 算法 编写 适当 ， 此 方法 还 可 以 提供 更 好 的 性 能 。 
面向 逻辑 的 安全 


有 了 时， 需要 根据 一 种 算法 来 实现 安全 性 。 例 如 ， 如 果 只 有 一 小 部 分 用 户 可 以 在 一 天 中 的 特定 时 间 访 问 特定 的 表 ， 那 么 会 发 生 
什么 事 ? 这 一 标准 可 以 编码 为 存储 过 程 。 执 行 存储 过 程 时 ， 它 会 检查 用 户 和 当天 的 时 间 才 允许 访问 。 


某 些 DBMS 产 品 提供 了 特殊 的 功能 来 确保 数据 库 的 安全 性 。 “Oracle 虚 拟 专用 数据 库 ” 就 是 这 种 功能 的 例子 。 


14.6 IVE 


用 于 数据 保护 的 另 一 项 安全 功能 是 加 密 。 数 据 加 密 是 一 个 使 用 算法 对 数据 进行 转换 的 过 程 ， 使 数据 对 任何 没有 解密 密 钥 的 人 
都 不 可 读 。 总 的 做 法 是 让 解密 非常 困难 ， 从 而 阻止 黑客 访问 未 经 授权 的 数据 。 加 密 和 解密 的 一 般 流程 如 图 14-4 中 所 描绘 的 。 


原始 数据 J SAN 


Maes FEY: “s&1Yu.8” 


图 14-4 ”加 密 和 解密 


加 密 转 换 数 据 ， 寻 致 任何 没有 解密 密 钥 的 人 都 无 法 读 取 它 。 


加 密 已 在 政府 和 军事 组 织 中 使 用 多 年 ， 完 成 秘密 的 数据 传输 和 通信 。 由 于 后 期 额外 的 数据 保护 和 监管 要 求 ， 加 密 更 常用 于 业 
务 系统 和 应 用 程序 。 


两 种 情况 下 可 以 部 署 数据 加 密 : 传输 过 程 中 的 数据 和 静态 数据 。 在 数据 库 方面 ，“ 静 态 ” 数 据 加 密 保护 存储 在 数据 库 中 的 数 
据 ， 而 “传输 过 程 ” 中 的 数据 加 密 用 于 保护 通过 网 络 传输 的 数据。 
Oracle 虚 拟 专用 数据 库 


通过 虚拟 专用 数据 库 (VPD) 技术 ，Oracle 提 供 了 行 级 访问 控制 。 通 过 将 一 个 或 多 个 安全 策略 与 表 或 视图 相关 联 来 启用 
VPD。 当 访问 表 时 ， 无 论 直接 还 是 间接 ， 数 据 库 将 咨询 实现 了 此 策略 的 功能 。 策 略 基 本 上 是 数据 库 附加 在 用 户 SQL 语 句 上 的 一 个 
SQL 谓 词 (或 WHERE 子 句 ) 。 这 动态 修改 用 户 的 数据 访问 。 


有 了 VPD， 用 户 能 够 检索 和 操作 与 策略 中 的 WHERE 子 句 相 匹配 的 唯一 数据 。 从 本 质 上 讲 ， 这 项 工作 就 像 创建 一 个 始终 应 用 
和 执行 的 动态 视图 (使 用 了 WITH CHECK OPTION) 。 


14.6.1 ”静态 数据 加 密 


加 密 静 态 数据 是 为 了 蔡 止 “幕后 ” 宕 探 信息 。 例 如 ， 一 个 包含 绝密 军事 计划 的 数据 库 。 当 然 ， 采 用 传统 的 数据 库 安全 性 和 授 
权 的 方法 〈 如 授予 那些 只 具有 适当 许可 的 人 访问 数据 ) ， 应 该 可 以 保护 好 数据 。 如 果 数 据 库 中 包含 的 数据 需要 不 同 程度 的 许可 要 
求 ， 可 以 通过 使 用 LBAC 技 术 采 取 额 外 的 预防 措施 。 但 是 ， 如 果 在 DBMS 的 控制 范围 之 外 访问 数据 呢 ? 


当 加 密 静 态 数据 时 ， 即 使 黑客 暗中 获得 数据 ， 没 有 解密 密 钥 ， 数 据 也 会 变 得 宫 无 意义 。 
果 没 有 解密 密 钥 ， 数 据 会 变 得 毫 无 意义 。 
数据 库 系 统 中 静态 数据 加 密 的 其 他 例子 包括 : 加 密 备份 数据 与 加 密 用 户 I1D 和 密 


静态 数据 加 密 通常 通过 使 用 SQL 功能 或 通过 一 个 附加 的 加 密 产品 来 实现 。Oracle 通 过 使 用 “钱包 ” ( 见 “Oracle 透 明 数据 加 
密 ”) ， 支 持 透明 数据 加 密 。 


14.6.2 ”传输 过 程 的 数据 加 密 


加 密 传输 过 程 的 数据 用 于 禁止 网 络 数据 包 嗅 探 。 如 果 在 通过 网 络 发 送 数据 之 前 对 其 进行 加 密 ， 且 在 目的 地 进 


行 解密 ， 数 据 传 
输 的 整个 过 程 都 受 保护 。 任 何 试图 访问 传输 过 程 数 据 的 人 将 只 能 接收 加 密 的 数据 。 在 没有 解密 密 钥 的 情况 下 ， 不 能 破译 


数据 。 


传输 过 程 中 加 密 数据 通常 由 DBMS 系 统 参 数 和 命令 支持 ， 或 通过 一 个 附加 的 加 密 产 品 来 支持 。 


14.6.3 ”加 密 技 术 


现代 DBMS 支 持 多 种 加 密 技术 和 算法 。 其 中 比较 常见 的 是 数据 加 密 标 准 (DES) 、 三 重 DES (TDES) 、 高 级 加 密 标准 
(AES) -128 位 数据 加 密 /解密 ， 以 及 安全 散 列 算法 (SHA-1) 和 SHA-256 散 列 。 


Oracle 透 明 数 据 加 密 
透明 的 数据 加 密使 你 能 够 对 单个 表 的 列 或 整个 表 进 行 加密 。 当 用 户 将 数据 播 入 一 个 加 密 列 时 ， 透 明 数 据 加 密 功 能 会 自动 对 数 


据 进行 加 密 。 当 用 户 选择 该 列 时 ， 数 据 会 自动 解密 。 


使 用 钱包 加 密 数 据 ， 这 是 一 个 位 于 数据 库 外 的 操作 系统 文件 。 数 据 库 使 用 钱包 存储 加 密 密 钥 。 使 用 ALTER SYSTEM 命 令 
(或 在 Oracle 企 业 管理 器 内 ) 来 创建 钱包 。 钱 包 本 身 是 加 密 的 ， 需 要 一 个 密码 作为 其 加 密 密 钥 。 要 访问 钱包 的 内 容 ， 必 须知 道 密 
码 。 创 建 钱包 后 ， 必 须 使 用 密码 才能 打开 它 ， 从 而 使 数据 库 可 以 访问 主 加 密 密 钥 。 钱 包 的 位 置 指定 在 sqlnet.ora 文 件 中 。 


所 以 ， 当 用 户 输 入 数据 时 ，Otacle 从 电子 钱包 中 检索 主 密 钥 ， 利 用 主 密 钥 解密 加 密 密 钥 ， 使 用 加 密 密 钥 对 用 户 输入 的 数据 进 
行 加 密 ， 并 将 其 存储 在 数据 库 中 。 当 用 户 访问 数据 时 ， 过 程 也 是 类 似 的 。Oracle 对 数据 进行 解密 并 以 清晰 的 文本 格式 显示 它 


14.7 ”SQL 注入 攻击 


数据 库 安 全 性 的 另 一 个 方面 是 正确 设计 应 用 程序 ， 以 避免 SQL 注入 攻击 。SQL 注 入 是 一 种 网 络 黑客 形式 ， 其 中 SQL 语句 指定 
在 一 个 Web 表 单 中 ， 造 成 Web 应 用 程序 设计 不 当 ， 并 将 数据 库 的 内 容 转 储 给 攻击 者 。SQL 注 入 是 网 络 黑客 最 喜欢 的 技术 ， 使 用 


其 进行 一 些 不 法 行为 的 消息 和 故事 比比 凡是 ( 见 “SQL 注入 攻击 实例 ”) 。 
SQL 攻击 是 一 种 网 络 黑 客 形式 ， 其 中 SQL 语句 指定 在 一 个 Web 表 单 中 ， 从 而 将 数据 暴露 给 攻击 者 。 


为 了 让 SQL 注入 成 功 ， 网 站 所 使 用 的 应 用 软件 必须 容易 受到 注入 攻击 的 伤害 。SQL 注 入 依赖 一 些 程序 ， 这 些 程序 不 会 充分 过 
滤 嵌 入 在 SQL 语句 中 或 用 户 输入 不 是 强 类 型 的 地 方 的 字符 串 文 字 转 义 字符 。 因 此 ， 不 是 将 数据 输入 表单 中 ， 而 是 提供 SQL 语句 。 
SQL 从 Web 表 单 注入 数据 库 ， 在 其 中 运行 并 访问 (甚至 修改 ) 意 想 不 到 的 数据 。 


也 许 通 过 例子 来 理解 SQL 注入 是 最 简单 的 。 考 虑 一 个 基于 Web 使 用 动态 SQL 的 应 用 程序 。 该 网 站 要 求 用 户 使 用 他 们 的 e-mail 
地 址 和 密码 登录 。 几 乎 所 有 这 类 网 站 还 提供 了 一 个 选项 ， 即 通过 提供 的 e-mail 地 址 找 回 密码 。 也 许 SQL 看 起 来 是 这 样 的 : 


SELECT userid, password 
FROM uid_pwd_table 
WHERE field = '$EMAIL'; 


变量 $EMAIL 表 示 在 网 站 上 的 表单 中 输入 。 一 个 精明 的 黑客 进行 SQL 注入 攻击 ， 可 以 尝试 输入 
anything’ OR '1'='1 


如 果 应 用 程序 没有 正确 检查 输入 ， 注 入 导致 SQL 看 起 来 像 这 样 : 


SELECT userid, password 
FROM uid_pwd_table 
WHERE field = ‘anything’ OR '1'='1'; 


这 将 导致 数据 库 中 每 个 用 户 的 ID 和 密码 的 完整 转 储 ， 因 为 OR ‘1’ = ‘1’ 始终 为 TRUE。 不 管 注入 的 第 一 部 分 是 什么 ， 可 以 
是 任何 东西 ， 因 为 注入 的 第 二 部 分 ， 将 表 中 所 有 数据 都 给 了 黑客 。 

SQL 注入 的 另 一 种 形式 依赖 输入 不 当 。 例 如 ， 没 有 检查 应 该 是 数字 的 数据 是 否 真 的 是 数字 。 例 如 : 

statement := "SELECT * FROM userinfo WHERE id = " + in_var + "3" 


在 这 种 情况 下 ，SQL 内 置 到 变量 语句 中 ，in_var 是 变量 ， 用 于 提供 输入 。 假 设 id 列 是 数字 。 但 是 ， 如 果 程 序 不 检查 in_var 变 
量 的 数据 类 型 来 确保 提供 的 是 数字 数据 ，SQL 注 入 可 能 发 生 。 例 如 ， 不 仅 提 供 一 个 数值 ， 黑 客 还 可 以 提供 : 


4;DROP TABLE customer 


这 条 SQL 语句 一 旦 建立 和 执行 ， 客 户 表 (如 果 有 ) 将 从 数据 库 中 删除 。 
SQL 注入 攻击 的 例子 


有 许多 使 用 SQL 注入 攻击 流行 Web 站 点 的 例子 。 例 如 : 


2006 年 1 月 13 日 ， 俄 罗斯 黑客 闻 入 Rhode Island 政 府 网 站 ， 得 到 了 与 国家 机 构 在 网 上 做 过 生意 的 居民 的 信用 卡 资料 
(www.xiom.com/whid-2006-3) 。 


2007 年 6 月 29 日 ， 黑 客 使 用 SQL 注 入 攻击 污 损 Microsoft 在 英国 的 网 站 (www.cgisecurity.com/2007/06/hacker-defaces.html) o 


2008 年 1 月 ， 数 万 台 个 人 计算 机 被 一 个 自动 SQL 注入 攻击 感染 ， 该 攻击 利用 应 用 程序 代码 中 的 漏洞 访问 Mictosoft SQL Server 数 


dé (www.pceworld.com/businesscenter/article/146048/mass_sql_injection_attack_targets_chinese_web_sites.html) o 


2010 年 9 月 19 日 ， 瑞 典 的 选举 中 ， 选 民 试 图 编写 SQL 语句 作为 选票 进行 攻击 注入 


(http: / /alicebobandmallory.com/articles/2010/09/23/did-little-bobby-tables-migrate-to-sweden) 。 


2011 年 6 月 ， 通 过 使 用 SQL 注入 ， 公 共 广 播 系 统 (PBS) 遭 到 黑客 攻击 (http:/blog.imperva.com/2011/05/pbs-breached-how- 
hackers-probably-did-it.html) 。 


2011 年 9 月 ， 土 耳 其 黑客 访问 NetNames DNS 记录 并 将 用 户 输 入 改写 到 他 们 自己 建立 的 网 站 (www.zone- 
h.org/news/id/4741) o 


2011 年 SQL 注入 攻击 的 其 他 网 站 包括 Battacuda Networks, mysql.com, Lady Gaga 的 个 人 网 站 、Nokia 开 发 网 站 、 佳 能 和 其 他 著 


名 组 织 。 


SQL 注 入 预防 


使 用 精心 设计 的 查询 语言 解析 和 编码 相应 的 应 用 程序 可 以 防止 SQL 注入 攻击 。 如 果 可 能 ， 使 用 静态 SQL (有 关 详 细 信 息 ， 请 
参阅 “静态 与 动态 SQL”) 。 


通过 测试 类 型 、 长 度 、 格 式 和 范围 ， 始 终 验 证 用 户 输 入 。 程 序 应 对 接收 到 的 数据 的 大 小 、 类 型 或 内 容 不 作 任何 假定 。 测 试 输 
入 的 大 小 和 数据 类 型 ， 并 执行 适当 的 限制 。 这 样 做 可 以 帮助 防止 缓冲 区 溢出 。 测 试 字符 串 变量 内 容 ， 只 对 预期 值 进行 处 理 。 任 何 
包含 二 进 制 数据 、 转 义 序列 和 注释 字符 的 输入 ， 应 断然 拒绝 。 


通过 测 斌 类型、 长度、 格式 和 范围 ， 始 终 验证 用 户 输入 。 
避免 串联 未 经 验证 的 用 户 输入 。 字 符 串 连接 是 SQL 注入 攻击 的 主要 入 口 点 。 此 外 ， 考 虑 使 用 存储 过 程 来 验证 用 户 输 入 。 


分 析 输 入 ， 并 拒绝 任何 包含 特殊 字符 的 输入 ， 如 分 号 (; ) 、 字 符 串 分 隔 符 (`) 、 注 释 分 隔 符 (- 
/*http://www.hzcourse.com/resource/readBook? 
path=/openresources/teach_ebook/uncompressed/14875/OEBPS/Text/...*/) 、V$ (Oracle DBA 视 图 的 开头 ) 和 
xp_ (SQL Server 目 录 存 储 过 程 的 开头 ) 。 


对 于 Microsoft SQL Server 用 户 ， 提 防 Transact-SQLprocedure xp_cmdshell。 这 个 程序 产生 一 个 Windows 命 令 ， 并 传递 
字符 串 使 其 执行 。 因 此 ，SQL 注 入 攻击 完全 有 可 能 ， 不 仅 窃 取 或 破坏 数据 ， 而 且 上 传 和 执行 自己 的 代码 、 探 测 网 络 ， 甚 至 将 SQL 
注入 受害 者 的 其 他 网 站 发 动 攻击 。 默 认 禁 用 xp_cmdshell， 用 这 种 方式 来 阻止 悉 意 用 户 使 用 命令 试图 提升 其 权限 是 一 个 不 错 的 做 
法 。 


事先 了 解 SQL 注 入 技术 和 适当 的 开发 程序 ， 所 有 的 SQL 注入 攻击 都 可 以 预防 。 
静态 与 动态 SQL 


使 用 静态 SQL (而 不 是 动态 SQL) 可 以 提高 数据 库 应 用 程序 和 数据 的 安全 性 。 静 态 SQL 硬 编码 到 应 用 程序 中 ， 运 行 时 不 能 更 
改 。 动 态 SQL 是 灵活 的 ， 可 以 在 运行 时 更 改 。 如 果 SQL 在 运行 时 可 以 更 改 ， 动 机 不 良和 有 经 验 的 黑客 可 能 会 秘密 更 改 SQL 或 部 署 
潜在 的 SQL 注入 攻击 ， 来 访问 未 经 授权 的 数据 。 


使 用 静态 SQL， 而 不 是 动态 SQL， 可 以 提高 安全 性 。 


静态 SQL 在 主机 DB2 应 用 程序 中 很 常见 ， 但 在 其 他 平台 和 数据 库 系统 中 不 太 常见 。DB2 BIND 命 令 “硬化 ”SQL 并 优化 数据 
的 访问 。 更 多 详细 信息 ， 请 参见 “DB2 BIND 命 令 ”。 


如 果 使 用 CL (如 ODBC 或 JDBC) 访问 数据 库 ， 静 态 SQL 不 是 一 个 好 选择 。 但 是 ， 你 可 以 使 用 存储 过 程 来 获得 类 似 于 静态 
SQL 的 保护 措施 。 


DB2 BIND 命 令 


BIND 命 令 可 以 认为 是 SQL 语 和 句 的 编译 器 。 一 般 情况 下 ，BIND 命 令 读 取 嵌入 在 应 用 程序 中 的 SQL 语 和 句 ， 并 产生 一 个 由 绑 定 的 
SQL 语句 指定 的 、 可 执行 的 数据 访问 路 径 。 一 旦 SQL 静态 绑 定 ， 不 经 过 再 次 BIND 就 不 能 更 改 。 


绑 定 可 以 执行 许多 功能 ， 创 建 访问 所 请 求 数据 的 数据 包 ， 包 括 读 取 程 序 中 的 SQL 语句 、 语 法 检查 、 元 数据 验证 、 授 权 验 证 和 
优化 。 


DB2 绑 定 的 附加 安全 功能 提供 了 ENABLE 和 DISABLE 选 项 ， 可 用 来 控制 执行 计划 或 绑 定 的 包 的 环境 。ENABLE 确 保 程序 仅 
在 已 启用 的 环境 中 操作 。DISABLE 允许 执 行 所 有 的 程序 ， 除 了 那些 明确 禁用 的 环境 。ENABLE 和 DISABILE 是 相互 排斥 的 参数 ， 
每 个 程序 包 只 可 以 使 用 一 个 。 例 如 ， 如 果 一 个 程序 指定 为 ENABLE (CICS) 绑 定 ， 只 有 CICS 事 务 管理 器 才 可 以 执行 该 程序 。 
种 方式 的 绑 定 使 DBA 能 够 有 效 地 禁止 在 一 个 环境 中 (如 网 上 CICIS) 执行 的 程序 (如 批 处 理 ) 被 暗中 使 用 到 另 一 个 环境 中 。 


14.8 审计 


审计 是 一 项 DBMSs 措 施 ， 使 DBA 能 够 跟踪 数据 库 资 源 和 权限 的 使 用 情况 。 当 启用 审计 时 ，DBMSs 将 产生 数据 库 操 作 的 审计 跟 
踪 。 每 个 被 审计 的 数据 库 操作 将 产生 一 个 审计 跟踪 信息 ， 包 括 哪些 数据 库 对 象 受到 影响 ， 谁 以 及 什么 时 间 执行 了 该 操作 。 根 据 
DBMS 所 支持 的 审计 级 别 ， 还 会 记录 实际 更 改 的 数据 。 跟 踊 谁 什么 时 候 对 哪些 数据 做 了 更 改 很 重要 ， 因 为 数据 的 安全 有 太 多 的 威 

胁 ( 见 “ 对 安全 的 威胁 ”) 。 


审计 使 DBA 能 够 跟踪 数据 库 资源 和 权限 的 使 用 情况 。 


一 旦 允许 访问 ,就 可 以 审计 跟踪 特定 用 户 的 操作 。 审 计 在 活动 后 进行 ， 且 不 会 对 禁止 访问 的 数据 进行 。 通 过 启用 安全 泄露 的 
检测 (也 称 为 入 侵 检 测 ) ， 审 计 跟 踪 有 助 于 促进 数据 的 完整 性 。 审 计 系 统 针对 算 改 数据 的 用 户 是 一 种 威慑 ， 因 为 它 可 以 有 效 地 识 
别 非法 入 侵 。 


审计 在 活动 后 进行 ， 且 不 会 对 禁止 访问 的 数据 进行 。 
第 15 章 关于 数据 库 审计 有 更 详细 的 信息 。 
对 安全 的 威胁 


外 部 代理 试图 损害 你 的 安全 以 及 访问 公司 的 数据 都 理所当然 地 看 作对 安全 的 威胁 。 但是， 业内 人 士 的 研究 表明 ， 许 多 安全 威 
胁 都 来 自 企 业内 部 。 最 典型 的 安全 威胁 是 可 以 访问 DBMS 却 心怀 不 满 或 怀 有 恶意 的 在 职员 工 或 前 员工 。 审 计 是 至 关 重 要 的 ， 因 为 
可 能 需要 找到 授权 用 户 的 未 经 授权 访问 的 实例 。 


14.9 ”外 部 安全 


除了 数据 库 的 安全 性 ，DBA 必 须 确保 DBMS 使 用 的 某 些 资源 不 被 DBMS 之 外 的 人 访问 。 如 果 不 使 用 DBMS 命 令 和 SQL 语句 访 


问 数据 库 资源 ， 就 不 能 依靠 数据 库 安 全 机 制 强制 执行 适当 的 用 户 身份 验证 。 
DBA 应 该 主要 集中 在 DBMS 使 用 的 数据 集 和 文件 上 。 


当 使 用 外 部 的 安全 机 制 来 保护 数据 库 相 关 的 资源 时 ，DBA 应 该 主要 集中 在 DBM 使 用 的 数据 集 和 文件 上 。 在 操作 系统 或 文件 
系统 级 保护 的 数据 集 包括 


“ 系统 目录 数据 文件 ; 

* 活动 和 归档 日 志文 件 ; 

“ 表 空 间 的 用 户 数据 集 ; 

-索引 的 用 户 数据 集 ; 

审计 数据 文件 ; 

- 性 能 跟踪 文件 ; 

. 程序 和 脚本 文件 ( 源 代码 和 可 执行 的 代码 ) 。 


如 果 没 有 保护 这 些 数 据 集 和 文件 ， 别 有 心思 的 用 户 可 能 会 找 出 这 些 文件 的 格式 并 访问 未 经 授权 的 数据 。 通 过 压缩 DBMS 内 的 
数据 ， 可 以 实现 额外 的 保护 级 别 。 这 会 对 尝试 解压 数据 的 黑客 增加 额外 的 难度 。 当 然 ， 压 缩 也 不 能 提供 足够 的 保护 。 


如 果 数 据 加 密 软件 可 用 于 数据 库 文件 ， 那 么 可 以 考虑 使 用 它 。 数 据 加 密 是 一 种 安全 技术 ， 将 可 读 的 数据 编码 成 杂乱 的 格式 ， 
使 得 在 没有 加 密 密 钥 的 情况 下 无 法 读 取 这 些 数据 。 总 的 想法 是 尽量 使 解密 复杂 化 ， 黑 客 便 无 法 访问 未 经 授权 的 数据 。 


DBMS 的 系统 资源 可 能 需要 额外 的 安全 保护 ， 如 用 来 运行 DBMS、DBMS 控 制 台 的 物理 存储 和 地 址 空间 ， 以 及 用 来 安装 
DBMS 的 文件 。 


14.9.1 ”作业 调度 和 安全 


大 多 数 企 业 会 安排 在 预定 的 时 间 执 行 任务 ， 当 这 些 任 务 涉及 数据 库 访问 时 ， 必 须 为 调度 程序 授予 权限 。 调 度 通常 使 用 第 三 方 
作业 调度 来 完成 ， 如 CA-7、Control-M 或 AutoSys。 当 调度 软件 用 来 控制 批 处 理 程 序 脚本 的 提交 和 调度 时 ，DBA 不 得 不 想 方 设 
法 给 调度 程序 授予 数据 库 安 全 。 


给 作业 调度 授予 SYSADM 权 限 不 是 一 种 好 的 做 法 。 这 样 会 允许 任何 工作 都 可 以 执行 任何 数据 库 任务 ， 进 而 导致 严重 的 安全 
问题 。 相 反 ， 使 用 调度 方案 和 DBMS， 可 以 确定 如 何 给 具体 的 作业 授予 个 别 权限 。 许 多 作业 调度 为 每 个 作业 生成 一 个 用 户 ID。 基 
于 为 该 作业 授予 的 行动 类 型 ， 可 以 为 这 个 ID 授予 适当 的 权限 。 


给 作业 调度 授予 SYSADM 权 限 不 是 一 种 好 的 做 法 。 


一 些 公司 的 另 一 个 常见 安全 错误 是 ， 将 实际 的 密码 嵌入 数据 库 实用 程序 作业 和 脚本 中 。 如 果 密 码 硬 编码 到 工作 中 ， 任 何人 都 
可 以 在 系统 的 任何 地 方 读 取 并 使 用 它 。 这 并 不 能 保护 数据 的 安全 性 。 


14.9.2 非 DBMS 的 DBA 安 全 


DBA 需 要 相当 高 的 操作 系统 的 权限 ， 以 便 执 行 企业 数据 库 和 数据 的 管理 工作 。 例 如 ， 在 UNIX 环 境 中 ， 一 些 安 装 任务 需要 
root 权 限 。 这 种 情况 可 以 有 两 种 处 理 方法 : 要 么 授予 DBA root 权 限 使 其 执行 安装 ;要 么 将 需要 root 权 限 的 特定 安装 任务 交 给 
UNIX 系 统管 理 员 。 随 便 哪 种 都 可 以 。 如 果 DBA 人 员 和 具备 所 需 的 UNIX 技 能 水 平 ， 了 解 拥有 root 权 限 的 后 果 ， 建 议 为 DBA 授 予 权 
限 。 不 过 ， 无 论 哪 种 方式 ，DBA 和 SA 都 需要 合作 ， 制 定 出 有 效 的 操作 系统 安全 管理 方法 ， 使 DBA 能 够 履行 自己 的 工作 ， 而 同时 
又 可 以 保护 该 平台 的 安全 性 和 完整 性 。 


14.10 DBMS 补 本 包 和 维护 


数据 库 安 全 性 的 另 一 个 重要 的 考虑 是 DBM 维护 计划 的 制订 和 实施 。 与 任何 系统 软件 类 似 ，DBMS 本 身 必 须 定 期 打 补 丁 来 纠 
正 DBMS 代 码 中 的 安全 缺陷 和 其 他 软件 缺陷 。 未 能 及 时 应 用 补丁 包 ， 可 能 会 导致 数据 库 的 安全 问题 。 这 些 补 丁 包 可 以 由 DBMS 供 
应 商 提 供 ， 也 可 以 自己 下 载 ， 或 者 通过 其 他 维护 渠道 获得 。 


请 参阅 “Oracle 数 据 库 补丁 ”， 讨 论 供应 商 (Oracle) 如 何 管理 其 DBMS 的 软件 维护 。 


Oracle 数 据 库 补丁 


Oracle 一 直 都 在 为 其 系统 软件 (包括 DBMS) 打 补 丁 。DBA 需 要 准备 两 种 类 型 的 补丁 程序 : 重要 补丁 更 新 和 安全 警报 。 


重要 补丁 更 新 是 发 布 Oracle 产 品 的 安全 修复 程序 给 有 效 支持 合同 的 客户 的 主要 方法 。 它 们 在 1 月 、4 月 、7 月 和 10 月 的 第 17 天 
前 后 的 周二 发 布 。 


安全 警报 由 Oracle 发 布 ， 用 于 漏洞 修复 ， 它 很 重要 以 致 不 能 等 到 下 一 个 重要 补丁 更 新 。 


当然 ， 你 应 该 对 每 个 补丁 进行 具体 的 评估 。 一 旦 有 重要 的 安全 补丁 ， 你 就 要 应 用 它们 。 另 一 方面 ， 你 可 能 要 延迟 应 用 那些 
DBMS 供 应 商 认 为 并 不 紧急 的 修复 程序 。 请 记 住 ， 补 丁 一 旦 应 用 ， 其 就 会 改变 你 的 系统 软件 ， 也 可 能 会 引入 其 他 瑕 瘦 和 缺陷 。 除 
非 有 足够 的 时 间 和 资源 对 每 一 个 补丁 进行 彻底 和 严格 的 测试 ， 否 则 最 好 只 应 用 那些 紧急 或 重要 的 补丁 。 


有 些 补丁 包 中 包含 数 以 百 计 的 软件 补丁 。 虽 然 在 DBMS 软 件 中 争取 通用 是 一 个 好 主意 ， 但 在 应 用 DBMS 供 应 商 提 供 的 每 一 个 
补丁 前 ， 都 要 经 过 审慎 的 判断 。 


14.11 小 结 


数据 库 安 全 是 DBA 工 作 的 重要 组 成 部 分 。 如 果 没 有 全 面 的 数据 库 安 全 计划 和 实施 ， 企 业 数 据 库 的 完整 性 将 可 能 受到 损害 。 
DBA 应 该 了 解 安 全 机 制 ， 确 保 只 有 授权 用 户 才能 访问 和 更 改 公司 数据 库 中 的 数据 。 


DBA 应 该 了 解 安全 机 制 。 


此 外 ，DBA 应 该 执行 审计 ， 以 验证 正在 部 署 的 数据 库 安 全 措施 是 否 充分 。 


14.12 [ale 


1. 登 录 的 目的 是 什么 ? 

2. 请 说 出 视图 可 以 用 来 实现 数据 安全 性 的 两 个 方法 。 

3. 登 录 密 码 一 旦 建立 ， 就 不 能 改变 。 这 种 说 法 正确 与 否 ? 
4. 哪 两 个 SQL DCL 语 句 可 用 来 建立 和 删除 数据 库 权 限 ? 


5. 如 果 密 码 需要 在 一 段 时 间 内 停 用 ， 但 后 来 可 能 需要 重新 激活 ， 可 以 而 不 能 ? 


6. 什 么 是 级 联 REVOKE， 它 对 数据 库 安全 有 什么 影响 ? 

7. 你 认为 “2926Glenmore” 是 一 个 好 密码 吗 ? 为 什么 ? 

8. 授 予 PUBLIC 权 限 会 产生 哪些 影响 ? 

9. 为 什么 使 用 DBMS 外 部 的 安全 机 制 来 保护 某 些 数据 库 资源 很 重要 ? 


10. 请 说 出 四 个 有 助 于 防止 SQL 注入 攻击 的 有 效 方法 。 
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第 15 草 合 规 性 和 数据 库 管理 


如 果 你 一 直 埋 头 工作 ， 可 能 已 经 错过 了 由 于 合 规 性 而 导致 的 数据 世界 的 翻天 履 地 的 变化 。 而 且 ， 即 使 你 已 经 注意 到 了 ， 不 符 
合法 规 事 情 的 数量 和 性 质 也 会 很 令 人 难以 置信 。 本 章 将 介绍 监管 环境 及 其 对 数据 库 管理 的 影响 。 


许多 行业 和 政府 法 规 促使 着 提高 数据 的 保护 和 管理 。 下 面 回 顾 一 些 其 中 著名 的 法 规 。 


最 令 人 注目 的 政府 法 规 是 “Sarbanes-Oxley” (SOX) 法 案 ，2002 年 正式 称 为 “美国 公众 公司 会 计 改 革 和 投资 者 保护 

法 ”。SOX 法 案 的 目的 是 规范 企业 ， 以 减少 欺诈 和 利益 冲突 ， 提 高 披露 和 财务 报告 并 加 强 公共 对 会 计 的 信心 。 但 这 条 法 律 对 IT 和 
数据 库 管理 的 影响 是 显著 的 。SOX 法 案 第 404 条 规定 ，CFO 不 仅 要 确保 他 们 公司 的 财政 状况 ， 还 必须 保证 所 使 用 过 程 的 总 数 。 这 
些 过 程 通常 是 访问 数据 库 中 数据 的 计算 机 程序 ， 而 这 些 数据 和 过 程 均 由 DBA 创 建 和 管理 。 “SOX 法 案 ” 还 要 求 财政 数据 可 以 防 
止 未 经 授权 的 访问 、 无 效 的 事务 ， 以 及 任何 其 他 类 型 可 能 影响 财务 报告 完整 性 的 修改 。 如 果 财 政 数据 在 数据 库 中 ， 该 数据 库 系统 
使 用 的 管理 规范 ， 必 须 公 布 出 来 让 大 家 遵守 。 因 此 ，Sarbanes-Oxley 法 案 要 求 数据 库 管理 规范 和 流程 要 有 额外 的 严谨 性 和 结 
构 。 当 然 ，DBA 管 理 的 企业 数据 库 系 统 在 SOX 之 前 。SOX 的 解释 和 监管 要 求 加 强 并 形式 化 这 些 规范 。 具 体 来 说 ， 数 据 库 安全 和 
访问 控制 的 规范 可 能 需要 修改 。 数 据 访问 审计 需要 更 综合 的 方法 ， 特 别 是 当 它 涉及 不 寻常 或 可 疑 的 活动 时 。 


此 外 ，sSarbanes-Oxley 法 案 要 求 ， 当 遇 到 一 些 逻 辑 或 物理 故障 ， 但 没有 丢失 可 以 影响 财务 报告 完整 性 的 数据 时 ， 公 司 的 财 
政 数 据 必须 可 以 完全 恢复 。 恢 复 必须 及 时 。 许 多 企业 可 能 很 久 都 没有 对 那些 用 于 数据 库 恢 复 的 备份 的 可 行 性 进行 测试 了 。 


许多 企业 可 能 很 久 都 没有 对 那些 用 于 数据 库 恢复 的 备份 的 可 行 性 进行 测试 了 。 


考虑 Health Insurance Portability and Accountablity Act， 通 常 简称 为 HIPAA。 此 法 案 指出 保健 提供 者 必须 保护 个 人 的 
医疗 保健 信息 ， 甚 至 规定 他 们 必须 记录 接受 过 他 们 服务 的 每 一 个 人 的 信息 。HIPAA 审 计 经 常 需要 检查 创建 、 记 录 和 审查 异常 报 
告 和 日 志 的 过 程 。 进 行 HIPAA 审 计时 ， 可 以 要 求 企 业 出 示 一 份 例外 列表 ， 如 “下 班 后 什么 时 间 可 以 查看 患者 的 病历 ， 以 及 由 谁 
查看 ? ”如 果 没 有 数据 库 审计 软件 ， 就 不 可 能 知道 哪些 用 户 查看 了 数据 库 中 某 些 特定 的 行 或 行 集 。 


Gramm-Leach-Bliley 法 案 (GLB 法 案 ) ， 也 称 为 1999 年 的 “金融 服务 现代 化 法 ”， 是 美国 颁布 的 联邦 法 律 ， 用 于 控制 金融 
机 构 处 理 私人 信息 的 方式 。GLB 法 案由 三 个 部 分 组 成 : 


- Financial Privacy Rule， 其 中 规定 私人 金融 信息 的 收集 和 披露 。 
- Safeguard Rule， 其 中 规定 金融 机 构 必 须 实 施 安全 方案 以 保护 这 些 信息 。 


` Pretexting ptovision， 禁 止 欺骗 〈 使 用 虚假 借口 访问 私人 信息 ) 。 


GLB 法 案 还 要 求 金融 机 构 给 予 客户 书面 隐私 声明 ， 解 释 其 信息 共享 的 做 法 。 


2002 年 通过 的 E-Government 法 案 作 为 对 奴 怖 主义 威胁 的 回应 。 法 案 第 三 篇 命名 为 “联邦 信息 安全 管理 法 案 
(FISMA) ”。 
与 安全 泄露 对 他 们 业务 的 潜在 影 


FISMA 基 本 规定 ， 联 邦 机构 、 承 包 商 和 支持 他 们 的 任何 实体 ， 必 须 保 持 与 潜在 风险 相符 的 安全 性 。 官 员 评 级 要 
影响 挂钩 。 


SOX、HIPAA、GLB 和 FISMA 是 政府 法 规 的 例子 。 但 遵守 行业 法 规 一 样 可 以 令 人 望而生畏 。 最 引 人 注 目的 行业 法 规 肯 定 要 
数 PCl DSS 了 ， 其 代表 支付 卡 行业 (PCI) 数据 安全 标准 (DSS) 。 它 是 由 主要 的 信用 卡 公司 开发 的 ， 来 帮助 防止 信用 卡 欺 诈 、 
黑客 和 其 他 安全 问题 。 处 理 、 存 储 或 传送 信用 卡号 码 的 公司 必须 各 


符合 PCI DSS 要 求 ， 否 则 将 失去 处 理 信用 卡 支 付 的 能 力 。 

因为 其 强大 的 影响 ， 合 规 性 对 大 多 数 中 型 或 大 型 企业 的 高 层 管理 人 员 起 到 了 强大 的 支配 影响 。 业 务 高 管 敏锐 地 意识 到 需要 遵 

守 ， 尽 管 他 们 并 不 十 分 清楚 涉及 的 所 有 细节 。 因 为 不 遵守 法 规 可 能 会 被 起 诉 ， 可 能 涉及 巨额 罚款 ， 甚 至 监禁 ( 见 “ 起 诉 的 现 

实 ”) 。 合 规 性 可 以 强加 于 C 级 以 上 管理 人 员 是 因为 他 们 能 够 证 明 企 业 数 据 (以 及 数据 库 系统 ) 受到 了 保护 ， 流 程 和 程序 的 制定 
基于 准确 而 所 需 的 数据 。 


遵守 法 规 的 成 本 可 能 很 大 ， 但 不 遵守 法 规 的 代价 同样 大 ， 尤 其 是 应 考虑 潜在 的 罚款 和 失去 业务 这 些 因素 。 因 此 ， 大 家 不 可 能 
忽视 法 规 。 


起 诉 的 现实 
不 遵守 法 规 造成 起 诉 不 是 空穴来风 。 考 虑 如 下 这 些 成 功 起 诉 的 例子 : 


2006 年 5 月 25 日 ，Enron 公 司 前 首席 执行 官 Ken Lay 被 控 犯 有 十 项 罪 。 因 为 每 项 罪名 有 5~10 年 刑期 ，Lay 可 能 面临 20~30 年 徒 
刑 。 


然而 ， 在 预定 量刑 的 三 个 半月 前 他 死 了 。 Jeff Skilling (Enhton 另 一 位 前 CEO) 被 判 28 项 中 犯 了 19 项 罪名 ， 包 括 一 项 串 谍 及 一 
项 内 幕 交 易 。Skilling 被 判 24 年 零 4 个 月 的 联邦 监狱 


2005 年 6 月 ，80 万 WotrldCom 公 司 投资 者 被 授予 6 亿 元 定居 费 ; 支出 资金 来 源 是 被 告 ， 包 括 投资 银行 ， 审 计 公 司 ，WorldCom 公 
司 前 董事 。 法 官 指出 ， 这 些 定居 点 是 “历史 性 的 ”。 此 外 ，WorldCom 公 司 前 CEO Bernard Ebbets 被 判 犯 有 诈骗 罪 ， 判 处 25 年 徒 
刑 。 

刑 。 


2005 年 9 月 ，Tyco 前 CEO Dennis Kozlowski#eMark Swartz (Tyco 前 CFO) 因 从 Tyco 偷 几 百 万 美元 ， 分 别 被 判处 8 年 和 25 年 徒 
此 外 ，Kozlowski 支 付 70 万 美元 的 赔偿 ; Swartz 为 3500 万 美元 。 


2005 年 6 月 ，John Rigas (Adelphia 公 司 创始 人 和 前 CEO) 被 判处 15 年 徒刑 。 他 的 儿子 Tony， 还 犯 有 银行 欺诈、 证 券 欺 诈 和 阴 
谋 ， 被 判 20 年 徒刑 。 


但 


BR 


NT 


日 是 ， 不 是 每 个 起 诉 结果 都 会 定罪 。2005 年 3 月 ，Richard Scrushy，HealthSouth 的 创始 人 和 前 任 CEO ， 被 指 收费 $27 亿 美元 的 
利 ， 言 过 其 实 ， 被 无 罪 释放 。Scrushy 指 责 他 的 下 属 欺 诈 。 


15.1 ”实现 合 规 性 的 协作 万 法 


确保 合 规 性 需要 业务 用 户 、IT 和 法 律 部 门 之 间 共 同 的 努力 。 这 是 一 个 挑战 ， 因 为 这 三 个 不 同 的 群体 是 截然 不 同 的 ， 很 少 集体 
沟通 3 
(至 


。 上 只 在 不 得 不 面 对 的 时 候 才 与 法 律 部 门 交 流 ， 而 且 通 常 只 是 购买 软件 需要 拿 到 合同 语言 的 批文 。1T 会 定期 与 企业 用 户 沟 通 
少 他 们 应 该 ) ， 但 也 许 并 不 那么 有 效 ， 但 是 需要 以 下 三 个 条 件 : 


确保 合 规 性 需要 业务 用 户 、IT 和 法 律 部 门 之 间 共 同 的 努力 。 

» 企业 必须 了 解法 规 对 它们 数据 和 系统 的 法 律 要 求 。 

* 法 律 必须 参与 ， 解 释 法 规 的 法 律 语言 ， 并 确保 该 企业 已 采取 适当 的 措施 来 保护 自己 。 
“IT 部 门 必须 参与 政策 和 程序 的 实施 ， 制 定 技 术 来 支持 监管 任务 。 


企业 需要 按照 法 规 对 每 个 数据 元 素 的 影响 来 映射 和 分 类 它们 的 业务 数据 。 它 们 需要 考虑 这 些 问题 : 哪个 数据 元 素 在 那个 法 规 
的 控制 之 下 ? 法 规 要 求 我 们 以 什么 方式 来 管理 数据 ? 


一 旦 映射 ， 就 需要 制定 遵守 相关 规定 的 控制 措施 和 策略 。 这 可 能 需要 更 好 的 保护 和 安全 ， 执 行 更 长 的 数据 保留 周期 ， 施 加 更 
严格 的 隐私 制裁 ， 强 制 提高 数据 质量 等 。 


DBA 为 什么 要 天 心 合 规 性 
合 规 性 需要 从 CEO 开 始 ， 它 一 直 影 响 底下 的 员工 并 影响 数据 库 管理 。CEO 依 赖 CIO 以 确保 |T 流 程 符合 ，CIO 依 赖 |T 经 
理 ，DBA 经 理 控制 数据 库 系统 ， DBA 经 理 依赖 DBA， 确 保 数据 的 保护 和 控制 。 


合 规 性 对 数据 库 管理 的 影响 是 多 方面 的 。DBA 不 负责 制定 和 执行 合 规 性 ， 但 他 们 的 工作 受 合 规 性 相关 的 项 目 和 责任 的 影 
响 。 合 规 性 对 DBA 的 主要 影响 是 调查 、 安 装 和 管理 支持 合 规 性 的 技术 ， 特 别 是 关于 数据 和 DBMS 的 技术 。 


符合 DBA 的 主要 影响 是 调查 、 安 装 和 管理 支持 合 规 性 的 技术 。 
影响 数据 库 管理 的 合 规 性 相关 的 任务 包括 : 

元 数据 管理 和 数据 质量 ; 

+ 数据 库 和 数据 访问 审计 ; 

数据 屏蔽 和 模糊 ; 

:长 期 数据 保留 和 数据 库 归 档 ; 

更 紧密 的 跟踪 传统 的 DBA 任 务 (如 变更 管理 、 备 份 和 恢复 ) o 


本 章 其 余部 分 将 深入 讨论 这 些 主题 ， 使 DBA 了 解 合 规 性 对 他 们 工作 的 影响 。 


15.2 “元 数据 管理 、 数 据 质 量 和 数据 治理 


确保 数据 质量 是 合 规 性 的 重要 组 成 部 分 。 它 的 重要 性 不 能 低估 。 数 据 质量 不 好 造成 公司 至 少 要 花费 10% 的 收入 ， 也 可 能 会 达 
到 20%。 [1 软件 营销 和 技术 专家 Hollis Tibbetts!“ h: “不 正确 、 不 一 致 、 欺 诈 性 和 宛 余 的 数据 一 年 要 花 掉 美国 3 万 亿 以 上 。 


确保 数据 质量 是 合 规 性 的 重要 组 成 部 分 。 


尽管 如 此 ， 高 质量 的 数据 对 合 规 性 至 天 重要 。 想 想 吧 。 如 果 数 据 不 准确 ， 怎 么 能 确保 对 正确 的 数据 应 用 适当 的 控制 来 符合 相 


应 的 规定 ? 


[1] 托马斯 ' C. 里 德 曼 所 著 的 《Data:An Unfolding Quality Disatet》 ，DMReview，2004 年 8 月 。 


[2] http: //hollistibbetts.sys-con.com/node/1975126 


15.2.1 元 数据 


良好 的 数据 质量 从 元 数据 开始 。 本 书 第 22 章 专门 介绍 元 数据 管理 ， 所 以 此 处 不 再 详 述 。 为 了 使 用 合 规 控制 正确 的 数据 ， 准 
确 的 数据 定义 是 必需 的 。 
什么 是 元 数据 ? 
元 数据 描述 数据 ， 提 供 了 企业 更 容易 理解 和 消费 的 数据 形式 。 元 数据 回答 了 数据 用 户 的 以 下 问题 ; 谁 、 什 么 、 何 时 、 何 地 、 


为 什么 以 及 如 何 。 


为 了 确定 数据 适用 于 哪些 法 规 ， 需 要 元 数据 对 这 些 数据 进行 分 类 。 例 如 ，SOX 法 案 适 用 于 财政 数据 ，HIPAA 适 用 于 医疗 保 
健 数 据 等 。 有 些 数 据 适用 于 多 种 法 规 ， 有 些 数 据 根 本 不 适用 于 任何 法 规 。 如 果 没有 适当 的 元 数据 定义 ， 就 不 可 能 对 数据 应 用 合 规 
性 。 


15.2.2 ”数据 质量 


接 下 来 是 确保 数据 本 身 是 准确 的 。 对 错误 的 数据 施加 监管 一 点 意义 都 没有 。 这 引发 了 一 个 问题 “数据 质量 有 多 好 ? ”估计 显 
示 (平均 而 言 ) ， 数 据 质量 是 一 个 总 体 的 行业 问题 。 根 据 数据 质量 专家 Thomas C.Redman l: 工资 记录 的 变化 有 1% 的 错误 
率 ; 计 费 记录 有 2%~7% 的 错误 率 ; 信用 记录 的 错误 率 更 是 高 达 30%。 


但 作为 DBA 能 对 糟糕 的 数据 做 什么 ”数据 质量 是 一 个 企业 的 责任 ，DBA 可 以 设置 技术 控制 来 提供 帮助 。 在 数据 库 中 建立 约 
束 可 以 提高 整体 数据 质量 ， 还 有 第 4 章 中 讲 到 的 在 数据 库 中 定义 参照 完整 性 。 还 可 以 在 数据 库 中 适当 定义 其 他 约束 来 控制 独特 
性 ,以 及 使 用 CHECK 约 束 和 触发 器 控制 数据 值 范围 。 


提高 数据 质量 的 另 一 种 技术 是 数据 分 析 。 数 据 分 析 是 检查 现 有 数据 库 中 的 数据 并 收集 统计 数据 和 其 他 信息 的 过 程 。 数 据 分 析 
可 以 发 现 信息 的 质量 、 特 性 和 一 些 潜在 的 问题 。 使 用 数据 分 析 解 决 方案 收集 的 统计 信息 ， 业 务 分 析 师 可 以 承接 项 目 来 清理 数据 库 
中 的 问题 数据 。 


数据 分 析 可 以 发 现 信息 的 质量 、 特 征 和 一 些 潜 在 的 问题 。 


数据 分 析 可 以 大 大 减少 找到 问题 数据 所 需 的 时 间 和 资源 。 此 外 ， 它 使 业务 分 析 师 和 数据 管理 员 可 以 更 好 地 控制 企业 数据 的 维 
护 和 管理 。 


[1] Thomas C.Redman, DataQuality:Management and Tecbnology (New York, NY: Bantam, 1992) . 


15.2.3 ”数据 治理 


随 着 公司 努力 遵守 的 政府 法 规 越 来 越 多 也 越 来 越 严 格 ， 数 据 治 理 方案 逐渐 受到 大 家 的 欢迎 。 数 据 治理 方案 对 企业 数据 的 可 用 
性 、 适 用 性 、 完 整 性 和 安全 性 的 管理 进行 监督 。 健 全 的 数据 治理 方案 包括 一 个 管理 机 构 或 理事 会 ， 一 套 定义 了 的 程序 和 执行 这 些 
程序 的 计划 。 


因此 ， 一 个 具有 强大 的 数据 治理 规范 的 企业 对 其 信息 有 更 好 的 控制 权 。 当 数据 管理 作为 企业 官方 认可 的 要 求 来 制定 时 ， 数 据 
就 成 了 一 种 资产 。 这 意味 着 要 用 业务 属于 定义 数据 元 素 ， 要 分 配 数据 管理 员 ， 要 进行 数据 建 模 和 分 析 ， 要 定义 、 捕 获 和 管理 元 数 
据 ， 要 对 数据 进行 归档 便于 长 期 数据 保留 。 


所 有 这 一 切 对 数据 专家 都 应 该 是 好 消息 ， 他 们 一 直 都 想 在 企业 中 更 好 地 定义 和 使 用 数据 。 


15.3 ”数据 库 审 计 和 数据 访问 跟踪 


在 今天 这 个 充满 了 法 规 和 威胁 的 世界 ， 企 业 只 保护 它们 的 数据 是 远 远 不 够 的 。 保 护 这 种 最 宝贵 的 资产 ， 意 味 着 企业 必须 持续 
地 监测 它们 的 系统 ， 才 能 知道 到 底 谁 、 何 时 以 及 如 何 对 它们 的 数据 做 了 哪些 操作 。 


增加 的 法 规 要 求实 施 可 以 保护 敏感 数据 的 政策 和 程序 。 例 如 ， 医 务 人 员 必 须 遵守 HIPAA， 从 而 使 他 们 在 使 用 技术 、 管 理 和 
保护 他 们 的 数据 时 保持 警惕 。 当 敏感 数据 存储 在 DBMS 中 时 ， 必 须 特别 关注 : 这 些 数 据 库 中 的 数据 是 如 何 进行 管理 的 。 


考虑 对 那些 接受 信用 卡 和 支付 卡 的 企业 的 影响 。 这 样 的 公司 必须 遵守 PCI DSS， 才 能 维护 处 理 信用 卡 事务 的 权力 。 因 此 ， 管 
理 人 员 必 须要 保护 他 们 的 数据 库 ， 只 有 正确 授权 的 实体 才 可 以 访问 他 们 需要 的 具体 数据 来 做 好 本 职工 作 ， 这 一 点 需要 证 明 。 


一 项 重要 的 技术 是 对 数据 库 数 据 的 访问 进行 审计 。 效 据 库 审计 是 监控 数据 库 内 选 定 的 数据 库 对 象 和 资源 的 访问 和 修改 的 过 
程 ， 并 保留 详细 的 访问 记录 ， 其 可 用 于 主动 触发 器 操作 ， 并 且 可 以 在 需要 时 用 于 检索 和 分 析 。 这 可 以 通过 使 用 数据 库 审计 设备 来 
完成 。 表 15-1 提 供 了 几 个 有 代表 性 的 法 规 的 审计 要 求 。 


数据 库 审 记 是 监控 数据 库 内 选 定 的 数据 库 对 象 和 资源 的 访问 和 修改 的 过 程 。 


表 15-1 一 些 法 规 的 数据 库 审计 需求 


审计 需求 SOX PCI DSS GLB HIPAA 


访问 敏感 数据 (SELECT) | 中 ąz | è | X 
修改 敏感 数据 (INSERT, UPDATE, DELETE) Ca 人 | 

数据 库 变 更 /DDL (CREATE, ALTER, DROP) X 
安全 授权 /DCL (GRANT, REVOKE) X 


仅 通 过 使 用 数据 库 软 件 的 控制 来 设置 数据 库 授权 ， 还 无 法 充分 保护 企业 的 敏感 数据 。 因 为 使 用 简单 的 数据 库 授权 机 制 ， 不 能 
阻止 暗中 对 敏感 数据 的 访问 。 还 有 可 能 是 已 授权 的 用 户 恶 意 访问 数据 。 当 出 现 这 两 种 情况 时 ， 数 据 库 审计 可 以 帮助 保护 数据 。 


所 有 主要 的 DBMS 产 品 提供 了 内 置 的 审计 数据 库 的 能 力 ， 但 ISV 可 以 提供 更 强大 的 软件 ， 包 括 更 灵活 的 捕获 技术 、 预 先 打包 
的 合 规 报告 以 及 multi-DBMS 支 持 。 强 大 的 数据 库 审计 软件 可 以 全 面 跟踪 数据 库 资源 和 权限 的 使 用 。 当 启用 审计 时 ， 每 个 数据 库 
操作 都 会 产生 详细 的 审计 跟踪 信息 ， 其 中 包括 访问 了 什么 数据 、 谁 访问 的 以 及 什么 时 候 访 问 的 。 运 营 商 可 以 分 析 审 计 跟踪 并 生成 
显示 访问 和 修改 DBM S 敏 感 数据 的 报告 。 


审计 跟踪 在 很 多 情况 下 都 有 用 。 公 司 的 业务 规范 和 安全 政策 可 能 规定 用 户 要 有 全 面 的 能 力 来 跟踪 数据 的 所 有 变化 。 任 意 法 规 
都 可 能 需要 企业 对 数据 访问 进行 分 析 并 生成 一 份 定期 报告 。 你 可 能 一 直 都 需要 生成 详细 的 报告 ,或 者 只 需要 能 够 识别 出 每 个 数据 
完整 性 问题 的 根本 原因 。 所 有 这 些 目的 ， 借 助 审 计 都 更 容易 达到 。 


数据 库 审 计 可 以 回答 这 样 的 问题 ， 如 “ 谁 访问 了 Jones 先 生 的 付款 账户 明细 ? ”或 “Smith 夫 人 的 预约 时 间 是 什么 时 候 变 
的 ? ”以 及 “ 谁 改 了 预约 时 间 ? ”甚至 可 以 回答 更 详细 的 问题 ， 如 “ 变 之 前 的 预约 时 间 是 什么 时 候 ? ”能 够 回答 这 样 的 问题 对 合 
规 性 非常 重要 。 


有 一 种 典型 的 审计 工具 ， 人 允许 在 DBMS 范 围 内 进行 不 同 级 别 的 审计 ， 例 如 ， 在 数据 库 级 别 、 数 据 库 对 象 级 别 和 用 户 级 别 。 
DBMSs 审 计 工 具 的 最 大 问题 之 一 是 性 能 的 下 降 。 生 成 的 审核 跟踪 要 足够 详细 ， 能 够 捕捉 到 数据 库 变化 “之 前 ”和 “之 后 ”的 映 
像 。 但 是 ， 捕 捉 这 么 多 的 信息 ， 尤 其 是 对 一 个 繁忙 的 系统 ， 可 能 会 导致 性 能 下 降 。 此 外 ， 审 计 跟踪 必须 存储 在 某 个 地 方 ， 当 变化 
发 生 时 ， 可 能 会 有 问题 。 因 此 ， 大 多 数 审计 工具 允许 选择 性 地 创建 审计 记录 ， 以 最 大 限度 地 减少 性 能 和 存储 问题 。 


虽然 每 个 DBMS 提 供 不 同 的 审计 能 力 ， 但 是 DBMS 审 计 工 具 可 以 审计 的 一 些 常 见 的 项 目 包括 
. 登录 和 注销 尝试 (成 功 和 不 成 功 的 ) 5 

"数据库 服 务 器 重启 ，; 

具有 系统 管理 员 权 限 的 用 户 发 出 的 命令 ， 

. 试图 违反 完整 性 〈 其 中 变更 或 插入 的 数据 与 参照 、 唯 一 或 检查 约束 不 匹配 ) ; 

- SELECT, INSERT. UPDATE4#DELETE# 4 ; 

> 存储 过 程 的 执行 ; 

" 尝试 访问 数据 库 或 表 不 成 功 ( 授 权 失 败 ) ; 

* 系统 目录 表 变更 ; 

行 级 操作 。 

另外 注意 ,一 些 审计 功能 和 工具 也 可 以 用 来 进行 数据 恢复 ， 第 16 章 将 讨论 这 方面 的 内 容 。 
审计 也 可 以 用 于 数据 恢复 。 

如 果 启 用 了 数据 库 审计 ， 请 考虑 以 下 建议 : 


* 审计 会 消耗 大 量 的 系统 资源 。 当 审计 队列 已 满 时 ， 生 成 审计 记录 的 任务 将 等 待 ， 直 到 审计 任务 可 以 开始 。 如 果 影 响 了 性 
能 ， 应 考虑 使 用 更 大 的 审计 队列 。 最 后 ， 性 能 无 法 接受 时 停止 审计 。 


* 将 存储 安全 相关 信息 的 系统 目录 表 放 在 一 个 单独 的 、 非 活动 的 磁盘 中 。 这 将 因 减 少 头 争 用 而 提高 审计 性 能 。 


确保 用 于 存储 审计 数据 的 数据 集 或 表 不 填 满 。 当 审计 数据 集 填 满 时 ， 审 计 将 禁用 ， 当 前 审计 队列 的 记录 将 丢失 ， 任 何 试图 
将 数据 发 送 到 审计 队列 的 用 户 任务 都 将 取消 。 


15.3.1 数据 库 审计 技术 


有 几 种 流行 的 技术 可 用 于 数据 库 的 数据 的 审计 。 到 目前 ， 最 好 的 技术 可 以 主动 监控 数据 库 对 数据 库 服务 器 的 直接 操作 。 这 种 
技术 可 以 捕捉 所 有 的 数据 请 求 。 一 旦 在 服务 器 级 别 捕捉 到 所 有 的 审计 细节 ， 该 软件 可 以 保证 做 到 监测 所 有 的 访问 。 


生成 审计 跟踪 的 方法 非常 重要 。 基 本 上 有 五 个 选项 : 部 署 本 地 DBM SS 跟踪 ， 扫 描 数 据 库 事务 日 志 ， 添 加 手工 “审计 ”″” 列 ， 嗅 
探 网 络 流量 ， 或 从 源 (数据 库 服务 器 ) 获得 请 求 。 这 些 方 法 中 ， 只 有 最 后 一 种 为 数据 库 活动 提供 100% 的 可 见 度 ， 而 不 会 成 为 性 
能 漏洞 。 


有 五 种 技术 提供 数据 库 审 记 : 跟踪 ， 日 志 扫描 ， 审 记 列 ， 网 络 流量 嗅 探 和 获得 数据 库 服务 器 。 


跟踪 审计 或 解析 数据 库 日 志 技术 ， 可 能 错过 某 些 类 型 的 数据 库 活动 。 例 如 ， 本 地 DB2 审 计 采 用 跟踪 审计 。 但 是 ， 如 果 一 个 事 
务 不 止 一 次 在 一 个 恢复 单元 中 访问 表 ， 审 计 跟 踪 只 会 记录 第 一 次 访问 。 这 对 某 些 类 型 的 合 规 性 可 能 是 无 法 接受 的 。 

基于 日 志 的 审计 也 可 能 有 问题 。 因 为 这 种 审计 依赖 数据 库 日 志 ， 唯 一 可 以 捕 扣 的 活动 是 更 新 、 插 入 和 删除 。 有 些 法 规 (如 
HIPAA) 还 要 求 跟踪 读 取 ， 这 些 读 取 永 远 不 会 出 现在 事务 日 志 中 。 


有 些 音 畜 的 企业 只 是 想 简单 地 实施 审计 ， 它 们 试图 在 表 中 增加 “审计 ” 列 ， 如 last modified_date。 这 种 方法 的 基本 思路 
是 ， 进 行 任何 其 他 类 型 的 修改 时 ， 每 个 修改 程序 都 必须 更 新 last_modified_date。 但 这 种 做 法 很 不 明智 ， 审 计 人 员 往 往 不 喜欢 使 
用 ， 因 为 


审计 跟踪 应 保持 在 数据 库 之 外 。 
如 果 删 除 行 ， 就 会 失去 审计 数据 。 


你 不 能 保证 最 后 修改 的 数据 完全 准确 ， 因 为 该 方法 依赖 代码 ， 代 码 可 能 很 糟 糕 ， 也 可 能 是 一 个 被 遗忘 了 的 不 会 修改 
last_modified_date 列 的 更 新 程序 。 


. 有 人 可 能 会 碰巧 (或 恶意 ) 设置 审计 列 。 


现在 剩 下 最 后 两 种 方法 : 网 络 嗅 探 和 从 数据 库 服 务 器 获得 请 求 。 两 者 都 是 合理 的 ， 但 即使 网 络 嗅 探 也 可 能 会 漏 掉 应 审计 的 活 
动 。 考虑 DBA 在 数据 库 服 务 器 上 直接 进行 的 活动 。 如 果 该 活动 不 联网 ， 网 络 数据 包 嗅 探 器 就 无 法 跟踪 该 活动 。 另 一 个 需要 考虑 
的 是 (尤其 是 对 于 主机 数据 库 审计 ) ， 许 多 大 型 机 应 用 程序 完全 在 主机 运行 ， 不 需要 联网 请 求 (例如 ，CICSVDB2 应 用 ) 。 直 接 
从 服务 器 上 获得 请 求 是 唯一 一 种 监测 数据 库 活动 的 方法 ， 其 可 以 保证 不 漏 掉 任何 可 以 审计 的 活动 ， 无 论 是 平台 、DBMS， 还 是 活 
动 。 

在 为 数据 库 系 统 选择 和 实施 数据 库 审计 解决 方案 之 前 ， 应 先 研究 使 用 什么 方法 。 数 据 库 审计 和 解决 方案 应 该 提供 一 种 有 选择 性 
的 、 全 面 的 、 无 创 性 的 监督 机 制 。 


数据 库 审计 解决 方案 应 该 提供 一 种 有 选择 性 的 、 全 面 的 、 无 创 性 的 监督 机 制 。 


选择 性 意味 着 这 个 方案 应 该 根据 规则 ， 只 在 需要 审计 的 特定 数据 上 捕捉 审计 细节 。 一 般 的 经 验 法 则 是 ， 只 有 必须 经 过 审计 才 
合 规 的 数据 才 应 审计 ， 仅 此 而 已 。 


全 面 性 意味 着 解决 方案 必须 能 够 捕捉 到 可 审计 信息 的 完整 场景 。 应 该 能 够 捕捉 到 数据 库 读 取 和 修改 。 此 外 ， 它 需要 进行 审计 
收集 。 


无 创 性 意味 着 数据 库 审 计 软件 必须 能 够 对 数据 访问 进行 审计 ， 并 且 不 会 导致 性 能 下 降 。 数 据 库 审 计 增加 了 开销 ， 但 你 最 不 想 
看 到 的 是 启用 数据 库 审 计 会 影响 性 能 。 一 定 要 事先 测试 审计 收集 机 制 对 生产 工作 量 的 效率 ， 再 考虑 是 否 采用 这 一 机 制 。 


此 外 ， 符 合 合 规 性 且 强 大 的 数据 库 访问 审计 解决 方案 ， 应 该 至 少 能 够 回答 以 下 问题 : 
- 谁 访问 了 数据 ? 

* 在 什么 日 期 和 时 间 访 问 的 ? 

` 使 用 了 什么 程序 或 客户 端 软 件 来 访问 数据 ? 

- 从 什么 地 方 发 出 的 请 求 ? 

- 发 出 什么 SQL 来 访问 数据 ? 

. 请 求 是 否 成 功 ? 如 果 成 功 ， 检 索 了 多 少 行 数 据 ? 

" 如 果 请 求 是 一 个 修改 ， 修 改 了 哪些 数据 ? (修改 前 后 的 映像 应 该 保留 。) 


确保 遵守 烦琐 的 政府 和 行业 法 规 是 一 项 艰巨 的 任务 。 随 着 保护 数据 库 的 敏感 数据 不 受 来 自 网 络 和 企业 内 部 的 各 种 威胁 的 需求 
的 日 益 增长 ， 这 就 要 求 金融 高 管 亲自 负责 企业 数据 的 安全 。 当 企业 需要 满足 日 益 增长 的 监管 要 求 时 ， 数 据 访 问 审计 解决 方案 可 以 
帮助 它们 保持 警觉 。 


15.3.2 ”特权 用 户 审计 


数据 库 审计 最 常见 的 形式 之 一 是 特权 用 户 审计 。DBA 和 系统 管理 员 通 常 在 数据 库 中 会 授予 高 级 别 的 权限 ， 如 DBADM 或 
SYSADM 权 限 。 拥 有 该 授权 的 用 户 有 权 访 问 数 据 库 实例 及 其 所 有 数据 。DBA 是 值得 信赖 的 代理 商 ， 不 应 该 滥用 手中 的 权限 。 但 
一 般 在 这 种 情况 下 采取 的 是 “信任 ， 但 仍 验证 ”。DBA 的 工作 需要 高 级 别 的 权限 ， 但 同时 也 给 他 们 带 来 恶意 活动 的 机 会 。 实 施 
特权 用 户 审计 跟踪 这 些 用 户 的 所 有 操作 ， 是 一 个 明智 的 做 法 (FL “DBASE” ) 。 


信任 ， 但 仍 验证 。 


通过 数据 库 审 计 解 决 方案 来 执行 特权 用 户 跟踪 ， 可 以 确保 这 些 受 信任 用 户 的 行为 。 这 对 特权 用 户 和 内 部 审计 人 员 都 有 好 处 。 
DBA 可 以 保留 他 们 的 权限 ， 审 计 人 员 可 以 监测 DBA 的 行为 ， 确 保 这 些 行 为 适当 。 
DBA IETS 


2007-7 F] , Computerworld 四 (Certegy Check 服 务 公司 ，Fidelity National 信 息 服务 公司 的 附属 公司 ) 曝光 其 高 级 DBA 偷 窃 了 
约 2.3 亿 消费 者 的 数据 ， 并 将 其 卖 给 了 一 家 数据 代理 商 。 代 理 商 随即 将 其 中 一 些 数据 卖 给 了 其 他 公司 。 


这 一 事件 被 揭露 是 因为 Cettegy 的 一 个 客户 觉察 到 公司 涉及 的 少数 支票 交易 ， 可 能 和 收 到 客户 的 直接 电话 推销 以 及 邮寄 营销 材 
料 之 间 存 在 某 种 关联 。Cettegy 立 即 展开 调查 ， 但 没有 检测 到 任何 安全 系统 的 泄露 ， 此 后 交 由 法 院 调 查 这 一 事件 。 


最 终 ， 根 据 出 售 数 据 的 公司 这 一 线索 追查 下 去 。 该 员工 是 一 名 高 级 DBA， 委 托 其 定义 和 执行 数据 访问 权限 。 


[1] www.computerworld.com/s/atticle/9026166/Database_admin_steals_2.3M_consumet_records_at_Fidelity_National_subsidiary. 


15.4 ”数据 屏 菩 和 模糊 


数据 屏 菩 是 保护 非 生 产 数据 库 中 敏感 信息 偷窥 的 过 程 。 它 可 以 确保 敏感 数据 有 效 而 并 非 真正 的 数据 替换 。 目 标 是 ， 在 授权 环 
境外 不 可 访问 敏感 的 个 人 身份 信息 (Pll) 。 保 护 敏 感 数据 不 被 宽 探 ， 可 以 防止 欺诈 、 身 份 盗 穷 和 其 他 类 型 的 犯罪 活动 。 


PCI Dss 也 许 是 数据 库 系 统 中 屏蔽 数据 的 最 大 监管 驱动 ， 因 为 它 要 求 打 印 的 收据 单 必须 对 支付 卡号 进行 屏蔽 。 下 次 使 用 信用 
卡 支付 时 ， 可 以 看 一 下 收据 ， 信 用 卡号 码 应 该 不 完全 可 见 。 


屏蔽 数据 的 同时 配置 测试 环境 ， 以 便 创 建 用 于 支持 应 用 程序 开发 和 测试 的 副本 ， 这 样 做 就 不 会 暴露 敏感 信息 ， 从 而 避免 数据 
泄露 的 风险 。 有 效 的 生产 数据 由 可 用 的 、 完 整 的 但 不 正确 或 令 人 迷惑 的 数据 蔡 换 。 屏 蔽 之 后 ， 测 试 数据 就 像 生产 数据 一 样 可 用 ， 
但 信息 内 容 却 是 安全 的 。 另 一 种 数据 屏蔽 直接 适用 于 生产 数据 (或 生产 报告 ) ， 例 如 ， 前 面 的 PCI DSS。 换 句 话说， 数据 在 数据 
库 中 是 准确 的 ， 但 检索 和 显示 时 进行 了 屏蔽 。 


什么 是 Pll? 


个 人 身份 信息 (PIL) ， 可 用 于 唯一 识别 、 联 系 或 找到 一 个 人 的 信息 ， 或 者 可 以 与 其 他 资源 一 起 用 来 唯一 识别 个 人 身份 。 许 
多 法 规 规定 了 处 理 和 保护 PII 的 方式 。 


PILE 包括 全 名 、 身 份 证 号 码 (如 美国 的 社会 安全 号 码 ) 、IP 地 址 、 车 辆 识别 号 码 (VIN) 、 指 纹 、 出 生日 期 、 出 生地 、 信 用 


卡号 码 、 驾 驶 执照 号 码 和 遗传 信息 。 


数据 屏蔽 技术 


多 种 技术 都 可 以 用 于 数据 屏蔽 。 好 的 数据 屏蔽 方案 应 该 能 使 用 多 种 技术 。 常 用 的 技术 包括 

数据 屏蔽 解决 方案 应 该 能 够 使 用 多 种 技术 。 

* 蔡 代 技术 使 用 预先 准备 好 的 数据 集中 的 随机 值 来 蔡 代 现 有 的 数据 。 

混 洗 技术 使 用 现 有 的 数据 ， 并 在 行 之 间 移动 这 些 值 ， 这 样 的 方式 使 得 所 有 这 些 值 都 不 再 位 于 原来 的 行 。 

.号码 和 日 期 方差 技术 ， 为 了 混 消 现 有 的 值 在 指定 范围 内 改变 它们 。 例 如 ， 出 生日 期 可 以 在 加 上 或 减 去 90 天 的 范围 内 变化 。 
“加密 技术 可 以 打 乱 数据 算法 ， 这 项 技术 不 会 产生 逼真 的 数据 ， 可 以 使 数据 变 大 。 

` 归 零 技术 只 是 简单 地 删除 敏感 数据 。 


" 表 对 表 同 步 技术 屏蔽 数据 保证 结果 是 完整 的 。 如 果 两 个 表 使 用 了 具有 相同 数据 值 的 列 ， 并 且 其 中 一 个 表 屏 蔽 了 这 些 列 ， 第 
二 表 中 的 值 也 随 之 更 新 为 变更 后 的 值 。 


数据 屏蔽 最 根本 的 目的 在 于 ， 使 数据 通过 屏蔽 得 到 净化 ， 防 止 数 据 泄 露 和 黑客 。 如 果 已 经 对 数据 进行 了 屏蔽 ， 那 些 试图 窃取 
数据 的 人 的 阴谋 就 无 法 达成 。 


15.5 用 于 长 期 数据 保留 的 数据 库 归 档 


现在 的 企业 生成 和 保留 的 数据 比 历 史上 任何 时 候 都 要 多 。 许 多 因素 促成 了 这 个 现实 。 其 中 一 个 因素 是 一 般 的 数据 增长 。 据 业 
内 人 士 分 析 ， 企 业 数 据 每 年 都 会 翻番 。 此 外 ， 高 达 80% 的 数据 不 是 用 于 积极 开展 业务 的 。 


为 什么 要 生成 这 么 多 的 数据 ? 技术 的 进步 使 我 们 能 够 更 好 地 捕获 和 存储 数据 。 但 是 技术 本 身 不 会 充分 考虑 当前 数据 的 增长 
率 。 


数据 保留 有 内 部 和 外 部 两 个 原因 。 当 然 ， 如 果 一 个 企业 需要 数据 做 生意 赚钱 ， 这 些 数 据 将 保留 。 处 于 一 些 内 部 原因 ， 当 今 企 
业 存 储 数据 的 时 间 较 长 。 通 常情 况 下 ， 人 存储 数 据 的 时 间 比 原来 长 ， 便 于 进行 过 程 分 析 。 因 此 ， 企 业 都 倾向 于 长 期 保留 数据 。 


当今 企业 存储 数据 的 时 间 较 长 。 


但 外 部 的 原因 通常 受 法 律 和 政府 法 规 的 驱使 ， 人 迫使 企业 存储 更 多 的 数据 。 事 实 上 ， 保 留 数 据 是 合 规 性 的 一 个 重要 方面 ， 需 要 
重视 和 注意 。 保 留 数据 的 需要 ， 不 仅 受 一 些 常见 法 规 (如 Sarbanes-Oxley 和 HIPAA) 的 影响 ， 而 且 也 受 那些 控制 着 数据 必须 长 
时 间 保 留 的 150 多 个 国际 、 联 邦和 地 方法 律 的 影响 。 企 业 需 要 制定 归档 数据 库 数据 的 计划 ， 因 为 其 数据 保留 需求 的 时 间 越 来 越 
长 。 


15.5.1 数据 的 生命 周期 


由 于 数据 在 其 整个 生命 周期 中 一 直 都 在 移动 ， 其 过 程 有 五 个 不 同 的 阶段 : 创建 、 操 作 、 参 考 、 存 档 和 丢弃 ， 如 图 15-1 所 
示 。 数 据 通 常 通 过 事务 的 方式 ， 在 某 个 点 创建 。 创 建 一 段 时 间 后 ， 数 据 进 入 正常 工作 状态 。 开 展业 务 需 要 数据 。 操 作 状 态 随后 是 
参考 状态 。 在 这 个 阶段 仍然 需要 数据 进行 报告 和 查询 : 内 部 报告 、 外 部 报告 或 者 干脆 只 是 客户 咨询 。 然 后 ， 再 过 一 些 时 间 ， 数 据 
往 不 再 用 于 业务 目的 和 查询 。 但 为 了 监管 和 法 律 ， 数 据 必须 保存 ， 这 是 归档 状态 。 


=e 


在 指定 的 一 段 时 间 后 ， 不 再 需要 数据 ， 必 须 将 它们 丢弃 。 这 个 阶段 往往 会 跳 过 ， 因 为 数据 不 断 堆 积 起 来 ， 但 不 能 使 用 。 如 果 
没有 法 律 规定 要 求 保 留 数据 ， 那 么 应 该 将 其 销毁 。 如 果 业 务 或 监管 目的 并 不 需要 保留 数据 ， 数 据 就 变 成 了 负债 而 不 是 资产 。 保 留 
的 任何 数据 一 旦 泄露 出 去 ， 就 可 能 会 面临 起 诉 。 那 么 ， 如 果 没 有 法 律 要 求 你 这 样 做 ， 为 什么 要 让 其 他 人 用 你 保留 的 数据 对 付 你 
呢 ? 


创建 一 > 归档 t EF 


强制 保存 期 
m = 一 


图 15-1 数据 的 生命 周期 


数据 的 生命 周期 对 数据 存储 的 位 置 以 及 采用 的 技术 并 无 规定 。 但 因 多 方面 的 原因 ， 将 归档 数据 作为 一 个 阶段 是 有 道理 的 。 


15.5.2 ”数据 库 归档 


数据 库 归档 是 从 预期 不 会 再 使 用 的 操作 数据 库 中 删除 所 选 的 数据 记录 ， 并 将 其 存储 在 归档 数据 存储 中 以 便 需 要 时 检索 它们 的 
过 程 。 

往 下 进行 之 前 ， 先 彻底 弄 清楚 这 个 定义 。 定 义 为 州 除 ， 是 因为 将 数据 移 到 存档 ， 就 将 其 从 业务 数据 库 删除 了 。 如 果 操 作 仍 然 
需要 数据 ， 就 不 能 归档 。 当 数据 移动 到 归档 状态 ， 就 不 再 进行 查询 和 访问 了 ， 因 此 将 其 消除 并 没有 问题 。 

接 下 来 介绍 选 定 的 数据 记录 。 不 要 在 文件 或 表 级 别 归 档 数据 库 的 数据 。 我 们 需要 的 数据 是 ， 业 务 不 再 需要 但 仍 与 业务 相关 的 
特定 数据 。 归 档 必须 能 够 有 选择 性 地 选择 相关 数据 的 特定 部 分 ， 不 是 整个 数据 库 ， 也 不 是 整个 表 ， 更 不 是 某 个 特定 的 行 。 相 反 ， 
表示 一 个 业务 对 象 的 所 有 数据 在 同一 时 间 存 档 。 例 如 ， 如 果 选 择 归档 订单 数据 ， 也 要 归档 具体 订单 上 的 每 个 项 目 。 这 一 数据 可 能 
跨越 多 个 数据 库 结 构 。 

定义 接 下 来 的 点 非常 有 趣 : 将 数据 记录 存储 在 归档 数据 存储 中 。 技 术 人 员 有 时 会 混淆 数据 归档 与 清除 数据 ， 但 两 者 有 很 大 的 
不 同 (参见 “归档 与 清除 ”) 。 归 档 数 据 与 操作 数据 库 分 开 存 储 ， 并 且 不 需要 DBMS3 或 应 用 程序 。 归 档 数据 与 生产 系统 分 开 ， 并 
独立 于 生产 系统 。 归 档 对 数据 库 和 环境 都 有 好 处 ， 包 括 让 生产 系统 的 性 能 更 好 (因为 需要 搜索 的 数据 更 少 ) 以 及 可 以 更 好 地 保护 
归档 数据 (因为 数据 存储 在 一 个 单独 的 数据 存储 中 ) 。 


归档 数据 与 操作 数据 库 分 开 存 储 。 


定义 最 后 需要 澄清 的 部 分 是 : 在 需要 时 检索 它们 。 归 档 的 整个 目的 是 保留 数据 以 备 不 时 之 需 。 因 此 ， 数 据 必须 随时 可 用 ,不 
需要 大 量 的 人 工 干预 。 
归档 与 清除 
归档 数据 和 清除 数据 是 两 个 完全 不 同 的 过 程 。 归 档 数 据 是 从 操作 数据 库 中 删除 数据 但 还 将 其 保留 在 归档 数据 存储 中 。 清 除数 


据 从 操作 数据 存储 中 删除 数据 并 将 其 丢弃 。 


不 要 混淆 归档 数据 库 的 数据 与 清除 数据 库 中 的 数据 。 两 者 都 有 用 ， 但 它们 为 完全 不 同 的 目的 服务 。 
确定 数据 保留 的 范围 


从 操作 数据 库 归 档 数 据 之 前 ， 必 须 先 确定 到 底 必须 保留 哪些 数据 。 换 句 话说， 必须 在 业务 对 象 级 别 归 档 数据 。 另 一 种 说 法 
是 ， 需 要 归档 所 选 的 记录 。 这 一 点 很 重要 ， 因 为 不 仅 要 归档 一 些 特定 的 数据 ， 那 些 使 归档 数据 更 容易 理解 的 任何 相关 数据 ， 必 须 
一 起 归档 。 归 档 需要 有 选择 性 地 选择 相关 数据 的 特定 部 分 用 于 存档 ;表示 一 个 业务 对 象 的 所 有 数据 要 在 同一 时 间 归 档 。 


例如 ， 如 果 选 择 归 档 订单 数据 ， 你 也 希望 归档 具体 订单 上 的 每 个 项 目 。 想 想 遇 到 的 订单 录入 和 管理 系统 。 数 据 库 建 模 时 不 能 
让 所 有 数据 在 一 个 表 中 ， 如 果 不 想 产生 垃圾 。 有 一 个 ORDER 表 和 一 个 一 对 多 关联 的 ITEM 表 ， 因 为 一 个 订单 可 以 包含 一 个 以 上 的 
项 目 。 如 果 你 在 Amazon.com 订 购 三 本 书 ， 那 么 就 是 一 个 订单 上 有 三 个 项 目 。 


此 外 ， 系 统 可 能 会 跟踪 产品 和 客户 ， 这 样 就 会 有 一 个 CUSTOMER 表 ， 以 及 从 CUSTOMER 到 ORDER 的 一 对 多 的 关联 。 这 意 


味 着 ， 一 个 客户 可 以 订购 多 个 订单 ， 但 每 个 订单 只 对 应 一 个 单一 的 客户 。 还 可 以 有 一 个 PRODUCT 表 ， 以 及 从 PRODUCT 到 
ITEM 的 一 对 多 的 关联 。 这 意味 着 一 个 产品 可 以 在 多 个 订单 上 ， 但 每 个 单独 订单 中 只 有 一 个 这 种 产品 。 如 果 客户 订购 多 个 ， 需 要 
在 项 目的 数量 字段 中 指明 。 

只 是 为 了 有 趣 ， 假 设 有 一 个 叫 LOCATION 的 表 ， 存 储 产品 的 库存 信息 ， 如 储藏 箱 号 码 和 库存 量 。 从 PRODUCT 到 
LOCATION， 希 望 有 一 个 一 对 多 的 关联 。 这 意味 着 一 个 产品 可 以 存储 在 多 个 储存 箱 中 ， 但 每 个 储存 箱 只 包含 一 个 单一 的 产品 类 
型 。 这 个 数据 模型 的 示例 请 参阅 图 15-2。 


CUSTOMER 


PRODUCT 


LOCATION 


图 15-2 ”归档 数据 模型 


数据 跨越 数据 库 多 个 结构 ， 意 味 着 DB2 或 Oracle 的 表 和 段 ， 和 /或 IMS 的 数据 库 。 要 归档 哪些 数据 呢 ? 例如 ， 订 单 出 货 后 需 
要 对 订单 的 详细 信息 保留 10 年 时 间 。 我 们 真 的 需要 保留 所 有 的 订单 数据 整整 十 年 来 塞 满 操 作 数据 库 吗 ”大 概 不 需要 。 这 项 业务 
的 目的 ， 也 许 一 两 个 月 之 内 与 这 些 数据 有 关 。 它 们 用 于 报告 或 客户 咨询 的 时 间 是 一 年 到 18 个 月 。 因 此 ， 可 以 在 出 货 后 在 生产 数 
据 库 中 保留 两 年 然后 将 其 销毁 。 


但 是 需要 归档 哪些 数据 呢 ? 如 果 只 是 归档 ORDER 和 ITEM 表 ， 那 么 将 丢失 归档 文件 中 的 相关 信息 。 还 需要 参考 客户 和 产品 信 
息 。 也 就 是 说 ， 必 须 确保 归档 不 只 包含 ORDER 中 的 CUSTNO 和 ITEM 中 的 PRODNO。 还 需要 客户 的 姓名 和 联系 方式 。 如 果 客 户 
并 不 在 操作 数据 库 中 ，CUSTNO 18123546 有 什么 好 处 ? 没有 保留 产品 详细 信息 ，PRODNO 99 会 是 任何 用 户 吗 ? 


因此 ， 需 要 建立 归档 策略 ， 从 ORDER 表 归 档 订单 的 同时 ， 归 档 ITEM 表 中 的 相关 项 目 。 这 意味 着 当归 档 数 据 时 ， 从 操作 数据 
库 中 将 其 删除 ， 从 PRODUCT 找 出 相关 产品 并 从 CUSTOMER 中 找 出 客户 。 此 数据 与 ORDER 和 ITEM 数 据 一 起 移动 到 归档 ， 但 不 
是 从 操作 数据 库 中 删除 。 毕 竟 ， 这 些 产 品 可 能 会 在 没有 归档 的 其 他 订单 项 目 中 。 那 些 客户 也 可 能 持 有 没有 归档 的 其 他 订单 。 
此 ， 需 要 为 客户 和 产品 数据 创建 其 他 的 归档 计划 。 


定义 要 归档 的 数据 策略 是 必需 的 。 


制定 准确 目 有 用 的 数据 库 归 档 策略 不 是 一 件 烦 琐 的 事情 。 定 义 要 归档 哪些 数据 ， 以 及 如 何 进行 归档 要 求全 面 的 数据 库 技能 、 
商业 头脑 和 知识 、 法 律 和 政府 法 规 。 数 据 一 旦 不 再 用 于 操作 目的 ， 马 上 对 其 进行 归档 ， 可 以 最 大 限度 地 减少 数据 泄露 的 风险 。 当 
然 ， 这 不 是 归档 数据 的 首要 原因 ， 因 为 那样 很 可 能 将 数据 保存 在 一 个 为 长 期 保留 数据 而 预 留 的 存储 结构 中 很 长 一 段 时 间 。 


数据 库 归档 要 求 


先 来 看 看 数据 库 归档 解决 方案 所 需 的 众多 功能 。 也 许 最 重要 的 考虑 因素 是 ， 归 档 的 数据 必须 和 有 独立 的 硬件 和 软件 。 由 于 归档 
的 数据 必须 在 一 段 时 间 内 存在 ， 独 立 性 至 关 重 要 。 几 十 年 (或 更 长 ) 过 去 了 ， 数 据 归档 的 生产 系统 可 能 已 经 不 复 存 在 ， 人 至少 不 会 
以 同样 的 形式 存在 ， 也 许 根 本 不 存在 了 。 想 想 您 的 生产 应 用 程序 在 过 去 10 年 或 20 年 的 时 间 内 发 生 的 变化 。 期 望 今天 现 有 的 操作 
环境 一 直 存 在 ， 从 而 可 以 访问 归档 数据 是 完全 不 合理 的 。 数 据 库 在 不 断 改 变 。 随 之 而 来 的 是 ， 归 档 必 须 能 够 支持 多 种 不 同 的 数据 
结构 。 


归档 解决 方案 必须 能 够 存储 大 量 的 数据 。 因 为 存储 的 数据 越 多 ， 可 以 归档 的 数据 就 越 多 。 如 果 把 这 一 点 与 监管 规定 的 数据 保 
留 时 间 结 合 起 来 ， 就 会 有 一 个 爆炸 性 的 组 合 。 


归档 必须 能 够 管理 数据 很 长 一 段 时 间 。 许 多 数据 需要 保留 几 十 年 。 因 此 ， 归 档 的 数据 存在 的 时 间 比 系统 和 生成 它们 的 程序 员 
更 长 。 归 档 存在 的 时 间 比 存储 它们 的 介质 更 长 。 没 有 介质 能 够 永远 人 存在， 磁带 的 寿命 是 7 年 〈 另 请 参见 “过 时 的 硬件 ”) 。 
此 ， 即 使 换 了 介质 类 型 ， 归 档 也 必须 能 够 重新 利用 归档 数据 。 理 想 情 况 下 ， 这 应 该 在 介质 达到 其 使 用 寿命 时 自动 完成 。 

支持 合 规 性 的 数据 ， 一 旦 归档 必须 保持 不 变 。 所 以 归档 必须 能 够 防止 数据 修改 。 归 档 数据 应 提供 只 读 访问 〈 除 定期 管理 
Sh) 。 归 档 数据 必须 保证 是 真实 的 。 同 时 ， 还 必须 要 有 防止 暗中 修改 的 机 制 。 


支持 合 规 性 的 数据 ， 一 旦 归档 必须 保持 不 变 。 
最 后 ， 归 档 要 求 元 数据 要 有 意义 ， 无论 定义 归档 数据 的 元 数据 ， 还 是 定义 归档 哪些 数据 以 及 何 时 归档 的 元 数据 。 归 档 必须 能 


够 存储 以 上 第 一 种 元 数据 的 多 个 版 本 。 随 着 操作 模式 的 变化 ， 归 档 必 须 跟踪 并 在 这 些 变化 的 模式 中 起 作用 。 第 二 种 元 数据 控制 着 
什么 数据 、 什 么 时 间 归 档 、 从 哪里 归档 。 这 是 驱动 和 定义 归档 本 身 的 元 数据 。 这 两 种 类 型 的 元 数据 都 是 归档 操作 必需 的 。 


将 所 有 这 些 因素 考虑 进去 。 而 且 ， 安 全 、 持 久 的 归档 数据 存储 必须 用 于 保留 操作 不 再 需要 的 数据 ， 而 且 它 必须 使 归档 数据 的 
查询 检索 格式 有 意义 ， 直 到 归档 数据 被 丢弃 。 
操作 数据 库 不 再 长 时 间 维 护 历 史 数 据 。 随 着 时 间 的 推移 ， 数 据 库 归档 将 变 得 更 加 普遍 ， 聪 明 的 企业 现在 就 应 开始 规划 自己 的 
数据 库 归档 需求 。 
过 时 的 硬件 


当 规划 长 时 间 的 数据 存储 和 管理 时 ， 一 定 要 考虑 硬件 过 时 这 个 极 具 挑战 的 因素 。 将 数据 存储 在 现代 硬件 无 法 读 取 的 介质 上 很 
有 可 能 。 


一 位 顾问 讲述 了 SOX 恢 复试 运行 遇 到 这 种 问题 的 故事 。 该 公司 曾经 要 求 其 归档 供应 商 提供 7 年 前 的 归档 磁带 。 工 作 人 员 人 安装 
磁带 时 发 现 ， 在 数据 中 心 的 任何 地 方 都 没有 这 种 模式 的 磁带 驱动 器 。 事 实 上 ， 市 场 上 已 经 绝迹 了 。 他 们 不 得 不 在 eBay 上 购买 一 些 


二 手 磁带 。 


15.5.3 ”数据 库 归档 解决 方案 的 构成 


图 15-3 中 描绘 的 是 数据 库 归档 解决 方案 的 必要 组 成 部 分 。 从 图 的 项 部 开始 ， 数 据 库 有 两 种 操作 可 以 执行 : 数据 提取 和 数据 
召回 。 提 取消 除了 操作 数据 库 中 的 数据 ， 召 回 将 归档 数据 恢复 到 操作 数据 库 中 。 
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图 15-3 ”数据 库 归 档 的 构成 


整个 过 程 需要 元 数据 操作 。 必 须 捕获 、 验 证 和 提高 元 数据 来 驱动 归档 过 程 。 你 需要 知道 操作 数据 库 的 结构 和 归档 的 结构 。 此 
外 ， 一 个 强大 的 归档 解决 方案 必须 有 政策 基础 。 这 意味 着 ,编写 政策 规则 决定 归档 什么 样 的 数据 、 何 时 归档 ， 以 及 归档 数据 必须 
保留 多 久 才 可 以 丢弃 。 必 须 对 这 种 基于 政策 的 元 数据 进行 持续 的 维护 和 监测 。 


允许 直接 读 取 归档 的 查询 功能 也 很 重要 。 由 于 元 数据 的 差异 ， 对 归档 数据 存储 的 查询 并 不 一 定 是 最 有 效 的 访问 。 然 而 ， 归 档 
数据 的 查询 性 能 通常 不 是 很 敏感 ， 至 少 不 像 典型 的 事务 数据 一 样 。 


最 后 ， 持 续 维护 归档 数据 的 能 力也 很 重要 。 这 包括 管理 任务 (如 安全 性 ) 、 访 问 审计 、 结 构 的 管理 (如 重组 ) 、 备 份 和 恢复 
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15.5.4 _e-Discovery 对 DBA 的 影响 


数据 管理 专业 人 员 所 面临 的 迫在眉睫 的 问题 之 一 是 电子 化 准备 。 昌 然 法 规 只 要 求 长 时 间 保留 数据 ， 其 中 有 些 规 则 和 法 规 决定 
了 何 时 以 及 企业 如 何 访问 和 产生 要 保留 的 数据 。 保 留 数据 的 唯一 原因 是 有 可 能 再 次 需要 它 。 


按 要 求 产生 要 保留 的 数据 通常 受 诉讼 的 驱使 。 你 可 能 记得 在 电视 上 看 到 过 法 庭 开 庭 的 样子 ， 其 中 在 诉讼 发 现 过 程 中 需要 大 量 
的 纸 质 文件 。 但 是 时 代 变 了 ， 发 现 过 程 需要 越 来 越 多 的 电子 数据 。 这 就 是 说 ， 数 据 存 储 在 计算 机 上 ， 并 且 大 部 分 存储 在 数据 库 管 
理 系统 中 。 


发 现 过 程 中 需要 越 来 越 多 的 电子 数据 。 


这 使 我 想起 美国 联邦 民事 诉讼 规则 (FRCP) ， 这 是 由 美国 地 区 法 院 所 使 用 的 规则 ， 用 于 支配 法 律 程序 。 其 中 一 项 规则 用 于 
决定 管理 发 现 的 政策 。 发 现 是 开庭 前 的 一 个 诉讼 阶段 ， 在 这 期 间 ， 每 一 方 都 可 以 请 求 第 三 方 的 文件 和 其 他 证 据 ， 或 者 可 以 被 迫 制 
作证 据 。 


2006 年 年 底 ，FRCP 将 重点 放 在 电子 数据 上 ，FRCP 第 34b 条 规则 改 为 : “产生 备查 文档 的 一 方 必须 产生 它们 .…… 因 为 它们 都 
保存 在 日 常 业务 过 程 中 。” 这 种 改变 明确 迫使 企业 提高 自己 的 能 力 以 产生 电子 数据 。 


FRCP 第 37 条 增加 了 一 个 新 的 部 分 : 第 37f 条 ， 它 对 掠夺 的 制裁 提供 了 一 个 安全 的 港湾 。 按 照 该 条 规定 ，“ 若 无 特殊 情况 发 
Æ, 根据 本 规则 ， 法 院 不 会 对 例 行 的 、 善 意 的 电子 信息 系统 因 示 提供 电子 存储 信息 而 实施 制裁 。” 基 本 上 ， 本 法 规 的 焦点 在 于 ， 
企业 需要 制定 一 个 清晰 明确 、 执 行 良好 以 及 统一 执行 的 记录 来 保留 项 目 。 并 且 该 项 目 应 包括 数据 库 中 的 数据 。 建 立 数据 如 何 长 期 
保留 的 政策 和 程序 ， 可 以 提供 一 定 程度 的 保护 ， 使 其 不 受 掠夺 产生 的 “不 利 的 推论 ”的 影响 。 


FRCP 的 变化 可 能 还 有 其 他 影响 ， 尤 其 是 当 越 来 越 多 的 数据 泄露 和 规则 被 联邦 和 州 政府 法 律 表决 成 为 法 规 时 。 这 意味 着 ， 我 
们 需要 将 数据 当 作 企业 的 资产 ， 不 仅 停留 在 口头 上 ， 还 要 真 的 付 诸 行动 。 


15.6 ”密切 跟踪 传统 的 DBA 任 务 


合 规 性 也 可 以 帮助 改变 传统 DBA 程 序 和 流程 的 关注 点 。 当 然 ， 在 增加 政府 和 行业 法 规 之 前 ，DBA 就 一 直 在 管理 企业 的 数据 
库 系统 。 但 是 ， 法 规 的 解释 和 监管 要 求 往往 需要 加 强 并 形式 化 那些 DBA 规 范 。 具 体 来 说 ， 可 能 需要 对 数据 库 安 全 和 访问 控制 规 
范 进行 修改 。 数 据 访问 审计 可 能 需要 更 全 面 的 方法 ， 特 别 是 当 涉 及 不 寻常 或 可 疑 的 活动 时 。 但 是 ， 这 也 是 真正 靠得住 的 DBA 规 
范 ， 如 变更 管理 和 数据 库 的 备份 和 恢复 。 


15.6.1 数据库 变 更 管理 


许多 企业 没有 遵守 数据 库 对 象 严 格 、 形 式 化 的 变更 政策 。 此 外 ， 实 施 (或 撤销 ) 变更 所 需 的 一 连 串 命令 的 日 志 ， 可 能 需要 加 
强 ， 如 果 这 样 的 日 志 根 本 不 会 实施 。 


许多 法 规 要 求 记录 所 有 的 变更 ， 指 出 谁 做 了 什么 ， 每 个 变更 为 什么 发 生 。DBA 经 常 只 是 发 出 ALTER 命 令 来 变更 数据 库 ， 以 应 
对 性 能 问题 或 开发 要 求 。 尽 管 一 个 强大 的 数据 库 审计 解决 方案 能 够 捕捉 这 种 变更 ， 但 更 好 的 做 法 是 使 用 变更 管理 工具 ， 其 可 以 自 
动 跟踪 数据 库 的 变更 。 


最 好 的 做 法 是 使 用 变更 管理 工具 ， 自 动 跟踪 数据 库 的 变更 。 


只 要 使 用 数据 库 ，DBA 就 必须 处 理 变更 管理 。 但 在 许多 情况 下 ， 这 些 任 务 会 受到 低 成 本 、 临 时 的 攻击 。 也 许 没 有 足够 的 资 
金 供 DBA 使 用 ， 也 许 DBA 有 足够 的 能 力 来 变更 数据 库 结构 而 无 需 借助 工具 。 在 许多 情况 下 ， 如 果 规 则 再 严格 些 ， 这 就 不 可 以 接 
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15.6.2 ”数据 库 备份 和 恢复 


当 数 据 专业 人 员 考 虑 合 规 性 时 ， 人 往往 会 首先 考虑 生产 数据 库 中 的 数据 。 毕 竟 ， 它 用 于 业务 运行 必须 受到 保护 。 因 此 ， 执 行 数 
据 库 审计 就 会 知道 那些 人 对 哪些 数据 在 什么 时 间 做 了 哪些 操作 ， 或 者 制定 数据 库 安全 和 数据 保护 措施 ， 来 保护 数据 不 被 帘 探 ;我 
们 专注 于 提高 数据 的 质量 ， 以 确保 我 们 的 流程 准确 。 这 些 努 力 都 是 值得 的 ， 但 只 专注 于 积极 的 生产 数据 不 足以 确保 合 规 性 。 数 据 
库 恢复 也 是 一 个 合 规 的 问题 。 改 进 备 份 和 恢复 的 规范 和 流程 必须 是 合 规 计划 中 一 个 重要 的 组 成 部 分 


确保 数据 库 的 完整 性 和 可 用 性 是 备份 和 恢复 计划 的 首要 关注 点 。 但 是 ， 数 据 库 恢复 对 合 规 和 法 规 方面 呢 ? 通过 COBIT 来 看 看 
数据 库 恢复 ( 见 “COBIT 是 什么 ? ”) 。 
COBIT 是 什么 ? 


COBIT 是 IT 最 佳 实 践 的 框架 ， 企 业 可 以 用 它 来 改善 它们 的 IT 管理 ， 提 高 开 的 价值 ， 并 确保 IT 企业 的 目标 与 业务 目标 保持 一 
致 。 目 前 COBIT 的 指导 可 从 www.isaca.org/Knowledge-Center/cobit/Pages/FAQ.aspx 获 得 。IT 管 理 研究 所 由 ISACA (信息 系统 审计 
与 控制 研究 所 协会 ) 创建 。 


COBIT 是 通过 识别 和 管理 风险 ， 有 效 控制 确保 企业 治理 、 重 组 并 保护 作为 公司 资产 的 信息 的 价值 。COBIT 的 症结 是 将 [TT 和 
业务 目标 联系 起 来 ， 以 确定 业务 和 IT 所 有 者 的 责任 ， 并 且 监 控 性 能 ， 使 用 度量 和 成 熟 模型 对 它 进 行 评估 。 


COBIT 框 架 包括 34 项 具体 控制 目标 ， 分 为 四 个 域 : 计划 和 组 织 (PO) ， 获 取 和 实施 (AL ， 交 付 与 支持 (DS) ， 以 及 监测 
和 评估 (ME) 。COBIT 的 做 法 是 以 业务 为 重点 、 面 向 过 程 、 受 测量 驱动 以 及 基于 控制 。 最 佳 实践 框架 (如 COBIT) 是 确保 遵守 


法 规 (如 Satbanes-Oxley) 的 重要 工具 。 

不 要 将 COBIT 与 框架 混 消 ， 如 ITIL。ITIL 是 一 个 IT 服务 管理 框架 ， 用 于 识别 、 规 划 、 交 付 和 IT 支持 服务 的 业务 。COBIT 描 述 
为 “IT 部 门 需要 做 什么 ”， 而 ITIL 描 述 为 “IT 如 何 提供 这 些 服务 ”。 
COBIT 和 恢复 


数据 库 恢 复 有 待 解决 的 最 佳 实践 方法 ， 是 让 你 的 企业 做 什么 样 的 前 期 规划 和 日 常 监测 并 评价 COBIT 的 倡导 。 采 用 COBIT 最 佳 
实践 框架 的 企业 了 解 信息 对 其 业务 的 重要 性 ， 并 且 需 要 保证 其 完整 性 和 可 用 性 。 


当然 ， 合 规 不 是 迫使 DBA 制 定 所 有 数据 库 对 象 备份 策略 和 程序 的 首要 因素 。 这 应 该 是 业务 可 用 性 要 求 驱动 的 ， 大 多 数 DBA 
都 做 到 了 这 一 点 ， 至 少 在 一 定 程度 上 。 但 没有 做 过 的 是 对 其 备份 和 恢复 计划 进行 定期 的 系统 检查 ， 以 满足 他 们 的 恢复 时 间 目 标 ， 
甚至 确保 他 们 现 有 的 备份 是 有 效 的 ， 可 以 用 于 恢复 。 


可 恢复 性 通过 以 下 19 个 跨 三 个 过 程 域 的 COBIT 目 标 来 解决 : 
PO 9.4: 评估 风险 。 在 规划 和 组 织 过 程 中 ， 必 须 评估 数据 库 不 可 由 备份 恢复 的 风险 。 


- DS1.3 和 DS 1.4: 定义 和 管理 服务 级 别 。 需 要 度量 来 定义 用 于 恢复 的 服务 级 别 目标 。 你 知道 恢复 特定 数据 库 对 象 (或 一 系 
列 对 象 ) 需要 多 长 时 间 ? 如 果 不 知道 ， 你 怎么 能 保证 达到 或 超过 应 用 服务 的 服务 级 别 ? 


- DS3.2、DS3.3、DS3.4、DS3.5 和 DS3.8: 管理 性 能 和 能 力 。 通 过 提高 依赖 恢复 的 信息 和 IT 资源 的 可 用 性 ， 定 期 检查 恢复 有 
助 于 能 力 管 理 。 


- DS4.10、DS 4.11 和 DS4.12: 确保 持续 的 服务 。 再 次 强调 ， 不 能 确保 可 恢复 性 〈 包 括 将 数据 镜像 到 备份 IT 网 站 和 /或 异地 备 
份 数据 存储 ) ， 就 不 可 能 确保 服务 。 


- DS11.9, DS11.19, DS11.20, DS11.21, DS11.234eDS11.24: 管理 数据 。 任 何 问题 都 可 能 需要 可 恢复 性 作为 其 持续 数据 管 
理工 作 的 一 部 分 。COBIT 目 标 DS11.24 专 门 涉及 验证 备份 的 可 用 性 。 


< M1.1 和 M1.2: 监测 过 程 。 需 要 持续 监测 可 恢复 性 ， 来 验证 每 一 个 备份 工作 ， 以 及 它 在 环境 (上 日志、 内 存 、 系 统 资源 等 ) 
中 的 有 效 性 。 


企业 需要 获得 工具 并 实施 程序 ， 来 验证 它们 的 备份 的 完整 性 ， 系 统 设置 可 能 会 影响 它们 的 恢复 能 力 ， 以 及 与 数据 库 备份 和 恢 
复 相关 的 过 程 。 分 析 数 据 库 系统 、 数 据 和 备份 ， 并 确定 它们 的 有 效 性 和 可 用 性 应 该 是 一 个 常规 的 做 法 。 否 则 ， 系 统 故 障 、 逻 辑 错 
误 、 恶 意 破 坏 或 灾难 性 事件 可 能 使 你 的 数据 库 无 法 使 用 ， 影 响 你 的 业务 ， 甚 至 可 能 威胁 你 正在 进行 的 业务 持续 的 生存 能 力 。 


企业 需要 工具 和 实施 程序 来 验证 数据 库 备 份 的 完整 性 。 


15.7 de 


合 规 性 再 次 强调 了 许多 传统 的 DBA 任 务 ， 同 时 也 对 其 中 一 些 任 务 的 含义 进行 了 扩展 。 备 份 和 恢复 、 元 数据 管理 、 变 更 管理 
需要 额外 的 关注 ， 而 数据 库 审计 和 数据 库 归档 功能 可 能 是 最 先 需 要 的 。 这 会 为 数据 库 管理 带 来 额外 的 工作 量 。 


不 过 ,幸运 的 是 ,现在 高 层 企业 管理 人 员 ， 不 得 不 保证 其 公司 数据 的 准确 性 ， 并 且 可 以 帮助 确保 数据 准确 性 和 完整 性 的 工具 
也 不 再 是 一 种 奢侈 的 想法 ， 但 需要 避免 起 诉 。 


15.8 [Blea 


1. 确 保 合 规 需要 哪 三 方 的 协同 努力 ? 

2. 请 说 出 两 种 传统 的 DBA 职 责 ， 根 据 某 个 合 规 性 项 目 ， 它 们 可 能 需要 额外 的 关注 ? 
3. 对 不 遵守 合 规 进行 起 诉 不 只 是 空穴来风 ， 这 种 说 法 正确 与 否 ? 

4 定义 数据 库 归 档 ， 将 其 与 数据 清除 对 比 。 

5. 请 说 出 几 种 可 用 于 实现 数据 库 审计 的 技术 。 

6. 对 于 数据 库 系统 和 应 用 程序 ， 为 什么 元 数据 和 数据 质量 是 合 规 性 的 重要 方面 ? 
7. 数 据 屏蔽 的 目的 是 什么 ? 

8. 实 施 数据 库 审计 解决 方案 的 一 个 潜在 缺点 是 什么 ? 

9.Pll 是 什么 ? 


10. 有 些 企业 已 经 确定 保留 数据 超过 100 年 ， 这 种 说 法 正确 与 否 ? 
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第 16 章 ”数据 库 备 份 和 恢复 


当 一 个 新 的 数据 库 创 建成 功 ， 或 一 个 新 的 应 用 程序 上 线 时 ， 一 切 都 是 新 的 ， 都 按照 设计 运行 。 但 随 着 时 间 的 推移 ， 环 境 会 发 
生变 化 。 随 着 用 户 越 来 越 多 ， 数 据 越 来 越 多 ， 要 求 也 越 来 越 多 ， 于 是 添加 了 新 的 硬件 和 软件 。 系 统 被 拖 垮 了 ， 因 为 它们 每 天 都 在 
提供 服务 。 


DBA 必 须 准备 好 应 对 这 些 情 况 : 故障 影响 了 数据 库 的 有 效 性 、 完 整 性 或 可 用 性 。 应 对 故障 和 服务 中 断 是 DBA 的 工作 的 一 个 
重要 组 成 部 分 。DBA 能 否 做 出 相应 反应 直接 取决 于 是 否 有 一 套 精心 策划 的 数据 库 备份 和 恢复 办 法 。 


应 对 故障 和 服务 中 断 是 DBA 的 工作 的 一 个 重要 组 成 部 分 。 


16.1 备份 和 恢复 的 重要 性 


许多 DBA 相 信 在 所 有 工作 职责 中 ， 确 保 数据 库 和 应 用 程序 的 性 能 最 佳 是 最 重要 的 任务 ， 但 这 并 不 正确 。 这 些 DBA 混 淆 了 重 
要 性 的 先后 顺序 。 


相 比 建立 备份 计划 ， 大 多 数 DBA 更 多 的 时 候 是 在 进行 性 能 相关 的 任务 ， 他 们 管理 性 能 必须 比 恢复 数据 库 更 频繁 ,否则 他 们 
公司 会 有 大 问题 ! 但 可 恢复 性 应 在 (或 接近 ) DBA 任 务 列表 的 最 顶端 ， 绝 对 在 执行 性 能 之 前 。 为 什么 呢 ? 好 吧 ， 如 果 在 出 现 问 
题 后 你 不 能 恢复 数据 库 ， 访 问 速 度 多 快 都 没有 意义 ， 不 是 吗 ? 任何 人 都 会 快速 访问 到 错误 的 信息 。 保 持 公司 数据 库 中 的 信息 准 
确 、 安 全 和 可 访问 才 是 DBA 的 工作 。 


任何 人 都 会 快速 访问 到 错误 的 信息 。 


那么 DBA 需 要 做 什么 来 保证 数据 库 中 数据 的 可 用 性 和 准确 性 ”本 章 将 概述 数据 库 备 份 和 恢复 的 基础 知识 ， 并 为 你 建立 强大 
的 数据 库 备 份 和 恢复 计划 提供 指导 。 


16.2 ”问题 的 准备 工作 


许多 日 常 灾害 可 能 造成 系统 故障 。 在 计划 数据 库 备 份 和 恢复 策略 时 ， 一 定 要 考虑 折 有 这 些 不 同 的 数据 库 完 整 性 和 可 用 性 的 威 
胁 。 当 然 ， 明 智 的 做 法 是 采取 预防 措施 防止 故障 发 生 。 一 些 技术 (如 UPS 系 统 、 镜 像 磁盘 、 故 障 转移 技术 ) 可 以 最 大 限度 地 减少 
恢复 ， 但 再 多 的 规划 和 管理 也 不 能 阻止 意外 故障 的 发 生 。 


需要 恢复 的 数据 库 故障 可 以 分 为 三 类 : 


. 实例 故障 : 是 由 于 DBMS 内 部 异常 操作 系统 故障 ， 或 其 他 与 软件 相关 的 数据 库 故 障 。 在 某 些 情况 下 ， 实 例 故 障 可 能 会 导致 
数据 损坏 ， 需 要 进行 恢复 ， 但 通常 这 样 的 故障 不 损坏 数据 ， 因 此 ， 数 据 库 管理 系统 只 需 简单 地 重启 来 重建 正常 的 操作 。 


* 应 用 程序 (或 事务 ) 故障 : 在 错误 的 时 间 运 行程 序 或 脚本 ， 使 用 错误 的 输入 ， 或 运行 顺序 错误 时 就 会 出 现 此 种 故障 。 应 用 
程序 故障 通常 会 导致 数据 损坏 ， 需 要 进行 数据 库 还 原 或 恢复 。 越 早 识 别 和 纠正 应 用 程序 故障 ， 数 据 库 的 损坏 越 小 。 


- 介质 故障 也 有 可 能 损坏 数据 。 介 质 故 障 包 括 磁盘 存储 设备 损坏 、 文 件 系统 故 障 、 磁 带 退 化 或 损坏 ， 以 及 删除 数据 文件 。 虽 
然 内 存 芯 片 损坏 在 现实 中 并 不 常见 ， 它 也 可 能 会 导致 数据 损坏 。 介 质 故障 发 生 后 ， 数 据 库 将 可 能 出 现 这 样 的 状态 : 有 效 的 数据 不 
可 读 ， 无 效 的 数据 可 读 ， 或 者 违反 参照 完整 性 。 因 介质 故障 造成 的 断 电 ， 经 常 可 以 通过 实施 现代 的 磁盘 技术 (如 RAID) 来 避 
免 ， 有 关 更 多 细节 请 参阅 第 18 章 。 


常见 的 是 企业 在 单个 数据 库 服务 器 中 管理 TB 级 或 以 上 的 数据 。 


即使 存储 和 处 理 的 数据 量 增加 了 ,今天 的 企业 还 要 求 更 高 的 吞吐 量 和 全 天 候 的 可 用 性 。 不 久 前 ， 还 谈 到 了 干 兆 数据 。 现 在 很 
常见 的 是 企业 在 单个 数据 库 服 务 器 中 管理 TB 级 或 以 上 的 数据 。 因 此 ， 更 多 的 数据 要 持续 可 用 ， 并 且 处 理 必须 比 以 往 任何 时 候 都 
更 快 。 企 业 依靠 数据 来 开展 业务 ， 所 以 你 必须 准备 一 项 可 以 抵消 故障 的 计划 。 完 善 的 备份 和 恢复 计划 可 以 作为 数据 的 保险 。 


16.3 备份 


数据 库 备份 和 恢复 计划 的 一 个 基本 组 成 部 分 是 创建 数据 的 备份 副本 。 当 一 个 错误 发 生 时 ， 损 害 了 数据 库 的 完整 性 ， 数 据 的 备 
份 副本 可 以 用 来 恢复 或 还 原 数据 库 。 然 而 ， 备 份 数 据 库 并 非 如 此 简单 。 


备份 数据 库 ， 涉 及 制作 与 数据 一 致 的 数据 副本 (通常 是 图 像 形 式 ) ，COPY 实 用 程序 的 输出 副本 。 复 制 实用 程序 的 名 称 会 因 
DBMS 有 所 不 同 。 备 份 实 用 程序 通常 包括 BACKUP、COPY、DUMP 和 EXPORT。 某 些 DBMS 依 赖 本 机 操作 系统 的 文件 系统 命令 
来 备份 数据 。 然 而 ， 即 使 DBMS 提 供 内 部 的 备份 选项 ，DBA 也 可 以 选择 使 用 DBMS 以 外 的 工具 。 


备份 数据 库 涉及 制作 与 数据 一 致 的 数据 副本 。 


最 新 且 最 准确 的 映像 副本 可 以 为 数据 库 恢复 提供 基础 。DBA 必 须 保 证 映像 副本 是 最 新 的 和 最 准确 的 ， 并 且 保 证 备份 计划 基 
于 应 用 程序 的 恢复 需求 。DBA 将 利用 这 些 恢复 需求 来 确定 采取 映像 副本 备份 的 频率 以 及 手头 必须 保持 多 少 备 份 。 此 外 ， 为 了 恢 
复 ，DBA 必 须 确保 有 相应 的 日 志 记 录 或 备份 。 要 确定 数据 库 对 象 的 备份 频率 ， 可 以 考虑 恢复 该 对 象 需要 多 少时 间 。 恢 复 时 间 由 
以 下 因素 决定 


- 恢复 必须 处 理 的 日 志 记 录 数 量 。 
.日志 是 否 加 密 或 压缩 。 

.映像 副本 备份 是 否 加 密 或 压缩 。 

- 操作 人 员 安 装 和 拆 印 需求 磁带 所 花费 的 时 间 。 
. 读 取 恢复 所 需 的 日 志 部 分 所 花费 的 时 间 。 


“ 重新 处 理 变更 的 页 面 需要 的 时 间 。 


此 外 ， 恢 复 时 间 取 决 于 数据 库 管 理 系统 的 架构 。 例 如 ， 大 型 机 DB2 跟 踪 记录 范围 信息 ， 只 读 取 任何 恢复 操作 所 需 的 日 志文 
件 。 然 而 ， 有 些 DBMS 要 求 读 取 所 有 的 日 志文 件 来 扫描 恢复 所 需 的 信息 。 


请 记 住 ， 只 读 活动 (或 没有 活动 ) 出 现 才 需 要 数据 库 备 份 ， 只 使 用 备份 就 可 以 恢复 到 某 个 时 间 点 ， 不 需要 日 志文 件 。 这 可 以 
简化 恢复 ， 并 可 以 使 恢复 的 成 本 最 小 化 。 


一 般 情 况 下 ， 映 像 副 本 建 得 越 多 ， 恢 复 所 需 的 时 间 就 越 少 。 然 而 ， 制 作 映 像 副 本 备份 所 需 的 时 间 必 须 针 对 备份 过 程 中 并 行 处 
理 的 需要 进行 权衡 。 


DBA 必 须 决定 保留 多 少 完整 的 备份 副本 。 


DBA 必 须 决定 保留 多 少 完整 的 备份 副本 (数据 库 对 象 副本 和 日 志 副 本 ) 。 保 持 额外 的 副本 ， 有 时 你 可 以 在 恢复 过 程 中 恢复 
某 个 错误 (通过 切换 到 一 个 旧 的 备份 ) 。 保 留 期 限 应 至 少 有 两 个 完整 的 周期 。 制 作 预 定 的 表 空间 完整 映像 副本 时 ， 还 需要 最 新 的 
完整 映像 副本 以 及 至 少 一 个 其 他 以 前 的 副本 ， 还 要 有 自 最 早 的 映像 副本 以 来 创建 的 日 志 。 可 能 要 考虑 保留 副本 至 少 两 个 星期 是 否 
值得 。 当然 ， 决 定 保留 的 副本 数量 必须 根据 备份 能 够 保持 可 行 而 必须 要 维护 的 相关 日 志 的 数量 。 


映像 副本 备份 的 下 列 准则 有 助 于 保证 可 恢复 环境 : 

` 请 至 少 为 每 个 映像 副本 备份 制作 两 个 本 地 副本 ， 来 帮助 避免 介质 错误 〈 例 如 ， 一 个 损坏 的 磁带 ) 造成 的 不 可 恢复 的 状态 。 
.协调 本 地 备份 策略 与 灾难 恢复 备份 策略 。 许 多 备份 实用 程序 允许 同时 创建 本 地 备份 和 异地 备份 。 

- 每 个 数据 库 对 象 至 少 保留 两 个 映像 副本 备份 。 如 果 最 新 的 映像 副本 失效 ， 你 还 可 以 依靠 旧 副 本 进行 恢复 。 


. 考虑 在 磁盘 上 创建 映像 副本 备份 ， 然 后 将 其 迁移 到 磁带 (或 光盘 ， 如 CD 或 DVD) ， 这 可 以 加 快 映像 的 复制 过 程 。 磁 盘 比 
磁带 快 ， 而且 恢复 不 需 等 待 手动 装载 磁带 。 


当 映 像 副 本 备份 迁移 到 磁带 上 时 ， 考 虑 压缩 文件 来 减少 大 的 映像 副本 备份 文件 所 需 的 磁带 数量 。 这 通常 可 以 使 用 磁带 驱动 
器 来 完成 。 另 外 ， 还 要 考虑 加 密 敏 感 数据 的 备份 文件 。 


. 请 务必 在 备份 和 恢复 计划 中 包括 系统 目录 数据 库 对 象 。 系 统 目 录 数 据 应 该 每 周 备份 ， 对 于 非常 动态 的 系统 ， 也 许 要 更 频 
繁 。 每 当 发 出 DDL 时 ， 它 就 会 改变 系统 目录 中 的 数据 。 在 DDL 变 更 后 不 备份 系统 目录 ， 可 能 会 导致 变更 后 的 数据 库 对 象 在 恢复 
之 后 也 无 法 访问 。 


. 确保 备份 过 程 中 可 重新 启动 。 例 如 ， 考 虑 一 个 需要 3 个 小 时 才能 完成 的 数据 库 备份 过 程 。 如 果 两 个 半 小 时 后 这 个 过 程 失 
败 ， 应 该 只 需 半 小 时 完成 重启 。 如 果 备 份 不 可 重启 ， 就 必须 重新 从 头 开 始 备份 。 


* 备份 完成 后 ， 使 用 数据 库 管 理 系统 工具 来 验证 备份 的 正确 性 ， 例 如 ，DB2 db2ckbkp 操 作 或 Sybase BCP 实 用 工具 。 
` 没有 存储 在 数据 库 中 却 由 数据 库 应 用 程序 使 用 的 数据 ， 应 与 数据 库 对 象 同时 备份 。 


作为 一 个 经 验 法 则 ， 制 作 映 像 副本 备份 常常 中 断 日 常 业务 ， 但 通常 恢复 数据 库 对 象 所 需 的 时 间 不 多 。 当 然 ， 说 起 来 容易 做 起 
来 难 。 你 需要 及 时 了 解 每 个 数据 库 对 象 的 应 用 需求 ， 为 创建 映像 副本 备份 找到 平衡 。 


如 果 某 些 数 据 库 活动 没有 需求 ， 对 数据 库 对 象 进行 完整 的 映像 副本 备份 是 个 明智 的 决定 。 例 如 ， 在 重组 系统 目录 之 前 ， 对 所 
有 系统 目录 数据 库 对 象 进行 映像 副本 备份 。 


对 数据 库 对 象 进行 完整 的 映像 副本 备份 往往 是 一 个 明智 的 决定 。 


此 外 ， 每 次 重组 后 ， 应 该 对 重组 数据 库 对 象 进行 完整 的 映像 副本 备份 。 如 果 对 象 需要 恢复 ， 可 以 恢复 到 重组 后 的 版 本 而 不 是 


之 前 混乱 的 版 本 。 另 外 ， 如 果 对 重组 过 程 进行 了 记录 ， 不 需要 应 用 所 有 的 日 志 记 录 。 


需要 用 到 映像 副本 备份 的 另 一 种 情况 是 ， 数 据 加 载 到 一 个 禁用 日 志 记 录 的 表 中 。 使 用 加 载 实用 程序 将 数据 加 载 到 一 个 表 之 
后 ， 立 即 制作 完整 的 映像 副本 备份 。 即 使 你 启用 了 日 志 记 录 加 载 ， 明 智 的 做 法 是 在 数据 加 载 过 程 完成 后 创建 一 个 完整 的 映像 副本 
备份 。 这 样 ， 如 果 需 要 恢复 对 象 ， 就 不 需要 应 用 加 载 过 程 中 的 日 志 记录 。 


最 后 ， 时 间 点 恢复 后 应 制作 映像 副本 备份 。 这 将 确保 如 果 又 有 故障 友 生 ， 数 据 库 对 象 还 可 以 恢复 。 


16.3.1 ”完整 备份 与 增 量 备份 


可 以 采取 两 种 类 型 的 映像 副本 备份 : 完整 和 增 量 。 作 为 一 名 DBA， 你 需要 了 解 两 者 之 间 的 区 别 ， 并 根据 应 用 的 需要 和 数据 
库 活动 实施 正确 的 映像 副本 备份 策略 。 


可 以 采取 两 种 类 型 的 映像 副本 备份 : 完整 和 增 量 。 


一 个 完整 的 映像 副本 备份 是 在 进行 映像 复制 时 ， 数 据 库 对 象 中 所 有 数据 的 完整 副本 。 增 量 映像 副本 备份 (有 时 简称 为 差分 各 
份 ) ， 只 包含 上 次 完整 备份 或 增 量 映像 副本 之 后 发 生 改变 的 数据 。 采 取 增 量 备份 而 不 是 完整 备份 的 优点 是 ， 制 作 更 迅速 且 占 用 的 
磁盘 或 磁带 空间 更 少 。 它 的 缺点 在 于 ， 基 于 增 量 副本 的 恢复 需要 的 时 间 更 长 ， 因 为 在 某 些 情况 下 ， 在 人 存储 某 行 的 最 新 变更 之 前 ， 
该 行 已 经 有 过 多 次 更 新 。 


例如 ， 假 设 你 在 星期 一 清晨 2 点 制作 了 某 数据 库 对 象 的 完整 映像 副本 ， 然 后 在 接 下 三 个 工作 日 的 同一 时 间 又 制作 了 增 量 映 像 
副本 ( 见 图 16-1) ， 恢 复 表 空间 需要 应 用 完整 图 像 副 本 以 及 所 有 三 个 增 量 映像 副本 。 如 果 同 一 行 的 同一 列 在 周二 更 新 全 A", 
周三 为 “B”， 周 四 为 “C”， 恢 复 过 程 应 用 这 三 个 变化 才能 获得 准确 的 数据 。 如 果 每 天 晚上 都 制作 完整 映像 副本 ， 恢 复 过 程 只 
需要 应 用 最 新 的 映像 副本 备份 (其 包含 正确 的 值 ) 。 


| | 


a, A 


| Full | | Incr. | 
% ws 
备份 整个 周二 以 后 
数据 库 对 象 y 的 变更 yY 

gy 并 gf S 

| Incr | | Incr | 

周一 以 后 周三 以 后 

的 变更 的 变更 


图 16-1 映像 备份 副本 


某 些 DBMS 提 供 分 析 数 据 库 对 象 的 能 力 ， 确 定 是 否 使 用 完整 或 增 量 备 份 。 这 通常 采用 复制 实用 程序 的 选项 来 完成 。 如 果 存 在 
这 样 的 选项 ，DBA 可 以 运行 复制 实用 程序 ， 检 查 在 最 新 的 映像 副本 备份 中 哪些 数据 发 生 了 变更 。 此 外 ，DBA 可 以 设 定 一 个 阐 
值 ， 当 变更 的 数据 量 超过 这 一 阐 值 时 ， 就 可 以 制作 完整 的 映像 副本 ， 当 变更 的 数据 量 小 于 阐 值 时 ， 制 作 增 量 映像 副本 。 如 果 没 有 
该 选项 ，DBA 需 要 根据 自己 所 掌握 的 应 用 程序 知识 以 及 所 使 用 的 数据 库 来 设置 要 制作 的 映像 副本 备份 的 类 型 。 


大 多 数 数 据 库 对 象 都 设置 为 完整 映像 副本 备份 ， 而 不 是 增 量 映像 副本 。 增 量 副本 节省 的 时 间 只 在 少量 数据 变更 时 有 用 。 然 
而 ， 使 用 增 量 副本 恢复 可 能 会 很 麻烦 。 在 一 般 情 况 下 ， 两 个 备份 之 间 有 30%~409%6 或 更 多 的 数据 块 被 修改 时 ， 建 议 对 数据 库 对 象 
进行 完整 映像 副本 备份 。DBA 作 出 这 个 决定 ， 不 仅 基 于 数据 波动 ， 而 且 也 基于 数据 的 关键 性 、 可 用 性 要 求 和 DBMS 的 功能 等 


有 b= 于 。 

小 型 数据 库 对 象 更 青睐 完整 映像 副本 。 “小 ”的 定义 因 站 点 不 同 会 有 所 不 同 ， 因 DBMS 不 同 也 会 有 所 不 同 。 对 于 较 大 的 基于 

大 型 机 的 数据 库 ，“ 小 ”数据 库 对 象 可 能 是 150GB 到 200GB。 对 于 规模 更 小 ， 但 很 重要 的 基于 UNIX 的 数据 库 ， 一 个 “小 ”的 数 
据 库 对 象 可 能 是 100GB 至 150GB。 对 于 小 型 工作 组 或 基于 Windows 的 数据 库 网 站 ， 甚 至 一 个 100GB 的 数据 库 对 象 就 很 大 了 。 


考虑 使 用 增 量 映 像 副 本 来 减少 大 型 数据 库 对 象 的 批 处 理 窗口 ， 这 些 对 象 往往 在 两 个 映像 副本 备份 之 间 的 修改 很 少 。DBA 必 
须根 据 已 修改 的 数据 块 的 比例 来 决定 是 完整 还 是 增 量 ， 而 不 是 根据 已 修改 的 行 数 的 百分比 来 做 决定 。 在 一 般 情 况 下 ， 表 空间 变 大 
和 批 处 理 窗口 变 小 时 可 以 考虑 增 量 副本 备份 。 


此 外 ， 有 些 情 况 与 增 量 映像 副本 备份 不 兼容 。 有 些 DBMS 人 允许 用 户 在 执行 某 些 操作 和 实用 程序 时 禁用 日 志 记 录 。 如 果 采 取 行 
动 添加 或 变更 数据 时 不 需要 记录 ， 这 时 就 需要 完整 映像 副本 。 


有 些 情 况 与 增 量 映像 副本 备份 不 兼容 。 


合并 增 量 副本 


如 果 DBMS 支 持 增 量 映 像 副 本 备份 ， 它 也 可 能 支持 增 量 副 本 合并 。 合 并 实用 程序 (有 时 也 称 为 MERGECOPY) 可 用 于 将 多 
个 增 量 映像 副本 备份 合并 成 单个 增 量 副 本 备份 ， 或 将 一 个 完整 映像 副本 备份 与 一 个 或 多 个 增 量 映像 副本 备份 合并 ,创建 一 个 新 的 
完整 备份 。 


如 果 DBMS 支 持 合 并 增 量 副 本 ， 考 虑 在 创造 增 量 副 本 后 运行 合并 实用 程序 直接 创建 一 个 新 的 完整 映像 副本 。 运 行 合并 实用 程 
序 对 并 发 数据 访问 或 批 处 理 窗口 没有 影响 。 如 果 等 到 需要 恢复 时 再 运行 合并 ， 会 增加 停机 时 间 ， 因 为 合并 (或 类 似 的 处 理 ) ER 
复 过 程 中 发 生 ， 数 据 库 对 象 不 可 用 。 


16.3.2 ”数据 库 对 象 和 备份 


通常 情况 下 ， 映 像 副本 备份 发 生 在 数据 库 、 表 空间 或 表 级 别 。 支 持 的 级 别 取决 于 使 用 的 DBMS。 但 是 ， 一 般 情 况 下 ， 要 备份 
数据 库 对 象 或 包含 数据 的 对 象 。 越 细 粒 度 地 控制 DBM 提供 数据 库 对 象 备份 ， 有 效 实施 有 用 的 备份 和 恢复 策略 就 越 容 易 。 


复制 索引 


某 些 DBMS 支 持 索 引 的 备份 副本 。 事 实 上 ， 有 些 DBMS 要 求索 引 备份 ， 有 些 则 是 可 选 的 。 索 引 备 份 可 以 可 选 ， 因 为 DBMS 可 
以 根据 表 中 的 数据 重建 索引 。 因 此 ， 一 个 典型 的 恢复 场景 将 涉及 恢复 表 或 表 空间 ， 然 后 使 用 该 表 的 数据 来 重建 索引 。 如 果 DBMS 
支持 索引 备份 ， 你 可 以 选择 复制 索引 ， 然 后 使 用 索引 的 映像 副本 备份 恢复 。 


你 需要 考虑 是 否 复制 索引 。 


不 过 ， 作 为 一 名 DBA， 如 果 DBMS 支 持 索引 备份 ， 你 需要 考虑 是 否 复制 索引 。DBA 必 须 针 对 每 个 索引 考虑 “重建 或 恢 
复 ? ”的 问题 ， 必 须 索 引 的 数据 越 多 ， 恢 复 时 需要 索引 重建 的 时 间 就 越 长 。 对 于 较 大 的 表 ， 备 份 索 引 可 能 会 使 恢复 更 快 ， 虽 然 以 
备份 时 间 的 增加 为 代价 。 如 果 一 个 大 表 有 多 个 索引 ， 备 份 它们 也 可 以 使 恢复 更 快 。 但 是 ， 请 记 住 ， 在 定期 备份 过 程 中 运行 索引 备 
份 需 要 更 多 的 时 间 。 作 为 一 名 DBA， 在 作出 决定 之 前 ， 你 需要 对 备份 成 本 与 恢复 成 本 进行 权衡 。 


如 果 你 选择 备份 ， 而 不 是 重建 索引 ， 请 务必 同时 执行 数据 和 索引 备份 。 换 句 话说 ， 备 份 表 ( 表 空 间或 数据 库 ) 也 一 定 要 备份 
所 有 相关 的 索引 。 否 则 ， 可 能 会 导致 秦 引 与 恢复 后 的 数据 不 匹配 ， 从 而 导致 应 用 程序 无 法 使 用 ,或 者 更 糟糕 的 是 ， 应 用 程序 的 运 
行 结果 无 效 。 


16.3.3 DBMS 控 制 


DBMS 对 备份 和 恢复 过 程 的 控制 程度 因 DBM 不 同 而 不 同 。 一 些 DBMS 在 系统 目录 中 记录 备份 和 恢复 信息 。 然 后 这 些 信息 在 
恢复 过 程 用 于 确定 日 志 、 日 志 备 份 和 成 功 进行 恢复 所 需 的 数据 库 备 份 。z/OS 的 DB2 的 工作 方式 就 是 这 样 。 请 参阅 “DB2COPY 实 
用 程序 ”。DBMS 维 护 的 映像 副本 备份 信息 越 多 ， 就 越 可 以 在 恢复 过 程 中 合理 地 使 用 。 


男 一 方面 ,一 些 DBMS 不 在 系统 目录 中 记录 备份 和 恢复 信息 。 如 果 是 这 种 情况 ，DBA 必 须 跟 踪 映 像 副 本 备份 文件 ， 并 在 恢复 
过 程 中 保证 合理 使 用 它们 。Microsoft SQL Server 的 DBMS 就 以 这 种 方式 工作 。 每 当 制 作 一 个 备份 时 ，DBA 就 必须 捕获 备份 的 类 


型 、 时 间 、 日 期 等 相关 细节 。 在 恢复 过 程 中 ， 为 了 确保 恢复 有 效 ，DBA 必 须 以 正确 的 顺序 提供 备份 (数据库 对 象 和 日 志 ) 。 
一 些 DBMS 不 在 系统 目录 中 记录 备份 和 恢复 信息 。 


Oracle 数 据 库 的 备份 和 恢复 也 可 以 这 样 处 理 。 然 而 ， 大 多 数 企 业 都 不 选择 这 样 做 。Oracle 提 供 了 一 种 更 全 面 的 方法 用 于 管 
理 备份 和 恢复 ， 称 为 RMAN。RMAN (代表 恢复 管理 器 ) 是 一 种 实用 工具 ， 与 服务 器 会 话 建立 一 个 连接 ， 并 对 备份 和 恢复 操作 
中 的 数据 移动 进行 管理 。 使 用 RMAN 时 ，Oracle 备 份 和 恢复 操作 类 似 于 z/Os 的 DB2。 更 多 细节 ， 请 参阅 “使 用 Oracle RMAN 备 
份 和 恢复 ”。 


DB2 COPY 实 用 程序 


z/OS 的 DB2 使 用 复制 实用 程序 创建 映像 副本 备份 。 此 实用 程序 在 系统 目录 中 维护 映像 副本 信息 的 目录 。 每 一 次 成 功 执行 
COPY 实 用 程序 ，DB2 都 会 在 系统 目录 中 记录 用 于 显示 映像 副本 状态 的 信息 、 映 像 副 本 数据 集 名 称 和 文件 的 详细 信息 、 备 份 的 日 
期 和 时 间 、 日 志 信 息 。 这 些 信 息 由 DB2 RECOVER 实 用 程序 读 取 ， 从 而 启用 自动 表 空 间 和 索引 恢复 。 只 有 在 系统 目录 中 记录 有 效 
的 映像 副本 ， 才 可 以 使 用 DB2 恢 复 。 


随 着 时 间 的 推移 ， 映 像 副本 备份 已 经 过 时 。 制 作 了 新 的 备份 副本 ， 数 据 库 对 象 就 可 以 恢复 到 不 同 的 时 间 点 。DB2 DBA 必 须 
维护 系统 目录 中 的 信息 ， 因 为 如 果 系 统 目 录 中 有 过 时 和 不 必要 的 备份 行 可 能 会 减 慢 恢复 进程 。DBA 使 用 DB2 修 改 实用 程序 可 以 在 
系统 目录 中 删除 备份 信息 。 


16.3.4 并 皮 访 问 问题 
一 些 备份 技术 多 许 并 发 写 访问 数据 库 对 象 。 使 用 这 些 技术 ， 可 以 让 你 在 备份 过 程 中 ， 保 持 数据 在 线 ， 但 它 会 减 慢 后 续 恢复 ， 
因为 DBMS 必 须 检查 数据 库 日 志 来 确保 恢复 的 准确 性 。 


有 些 DBMS 和 恢复 实用 程序 提供 执行 变更 积累 的 能 力 。 这 种 变更 积累 的 过 程 通过 合并 现 有 的 映像 副本 与 数据 库 日 志 中 的 数 
据 ， 创 建 一 个 最 新 的 映像 副本 备份 。 这 类 似 于 增 量 映像 副本 合并 。 


有 些 映 像 副 本 备份 技术 允许 只 读 访问 数据 库 对 象 。 制 作 映 像 副本 之 前 ， 数 据 库 对 象 的 QUIESCE (在 16.3.5 节 中 解释 ) 建立 一 
致 性 点 。 相 比 人 允许 并 发 读 写 的 备份 ， 允 许 只 读 访问 的 备份 可 以 提供 更 快 的 恢复 ， 因 为 数据 库 日 志 不 需要 确保 恢复 的 正确 性 。 


最 后 ， 有 些 映 像 副本 备份 技术 需要 数据 库 对 象 停止 运行 或 完全 脱 机 。 在 这 种 情况 下 ， 任 何人 都 无 法 读 取 或 写 入 表 空 间 。 这 类 
副本 可 以 提供 快速 备份 ， 因 为 没有 人 争 用 表 空 间 。 


DBA 必 须 了 解 企业 中 每 个 DBMS 的 备份 功能 ， 计 划 适 当 的 备份 策略 。 
DBA 必 须 了 解 企 业 中 每 个 DBMS 组 织 的 备份 功能 。 

“ 备份 过 程 中 并 发 访问 和 修改 的 必要 性 。 

+ 备份 的 时 间 以 及 备份 数据 的 速度 对 并 发 访问 的 影响 。 

* 恢复 实用 程序 的 速度 。 

- 访问 数据 库 日 志 的 必要 性 。 


有 些 DBMS 使 用 术语 热 备份 和 冷 备 份 来 形容 数据 备份 时 可 能 出 现 的 并 发 访问 。 冷 备份 是 通过 关闭 数据 库 实 例 和 备份 相关 的 数 


据 库 文件 来 完成 的 。 热 备份 是 数据 库 实例 保持 联机 状态 ， 这 意味 着 可 以 并 发 访问 。 根 据 正在 使 用 的 DBMS 的 功能 ， 热 备份 是 有 问 
题 的 ， 因 为 


“ 它们 实施 起 来 更 复杂 。 


门 可 以 导致 额外 的 开销 : 更 高 的 CPU、 额 外 的 I/O 和 额外 的 数据 库 日 志 归 档 。 


o 


门 可 能 要 求 DBA 创 建 特定 站 点 的 脚本 来 执行 热 备份 。 


o 


门 需要 广泛 的 测试 ， 以 确保 备份 恢复 是 可 行 的 。 


o 


使 用 Oracle RMAN 备 份 和 恢复 
RMAN 是 一 个 功能 强大 的 程序 ， 用 于 管理 Oracle 数 据 备份 和 恢复 。DBA 可 以 使 用 RMAN 备 份 命令 指定 进行 备份 的 文件 或 归档 
日 志 。 这 样 做 会 导致 RMAN 创 建 备份 集 作为 输出 。 备 份 集 是 由 RMAN 以 专 有 格式 写 入 的 一 个 或 多 个 数据 文件 、 控 制 文件 或 归档 重 
做 日 志 。 使 用 备份 集 恢复 的 唯一 方法 是 使 用 RMAN 恢 复命 令 。 当 然 ，DBA 可 以 选择 使 用 COPY 命 令 代 兰 。 这 将 创建 文件 的 一 个 映 


像 副本 ， 可 以 在 RMAN 的 范围 之 外 使 用 。 


RMAN 从 控制 文件 或 可 选 的 恢复 目录 中 访问 备份 和 恢复 信息 。 恢 复 目 录 类 似 于 DBMS 系 统 目 录 ， 但 它 仅 包含 备份 和 恢复 元 数 
据 。 


请 记 住 ，RMAN 是 控制 Oracle 数 据 的 备份 和 恢复 工具 。 它 本 身 不 执行 备份 和 恢复 ， 相 反 ， 它 控制 何 时 以 及 如 何 备份 ， 可 以 用 
来 协调 恢复 过 程 和 任务 。 


RMAN 一 般 比 其 他 Oftacle 备 份 恢复 的 方法 更 合适 ， 因 为 它 更 容易 使 用 并 提供 更 多 的 功能 。 例 如 ，RMAN 能 够 创建 增 量 备份 。 
而 使 用 传统 的 Oracle 备 份 和 恢复 方法 ， 只 有 完整 映像 副本 备份 可 用 。 


16.3.5 ”备份 的 一 致 性 


请 确保 备份 计划 为 数据 库 对 象 创建 一 个 一 致 的 恢复 点 。 为 了 确保 备份 的 一 致 性 ， 需 要 知道 正在 备份 的 数据 库 对 象 和 其 他 数据 
库 对 象 之 间 的 所 有 关联 。 这 些 包 括 应 用 程序 执行 的 关联 、 引 用 约束 和 触发 器 。 如 果 使 用 映像 副本 备份 来 将 数据 库 对 象 恢复 到 以 前 
的 时 间 点 ， 那 就 需要 将 任何 相关 的 数据 库 对 象 恢复 到 同一 时 间 点 。 如 果 不 这 样 做 很 可 能 会 导致 数据 不 一 致 。 


如 果 DBMS 提 供 QUIESCE 实 用 工具 ， 在 备份 之 前 用 来 为 所 有 相关 的 数据 库 对 象 建 立 一 个 一 致 点 。QUIESCE 实 用 工具 将 停止 
数据 库 对 象 的 修改 请 求 ， 以 确保 一 致 性 和 记录 数据 库 日 志 的 一 致 点 。 甚 至 可 以 在 不 需要 复制 数据 库 对 象 时 使 用 QUIESCE 实 用 工 


如 果 DBMS 不 提供 QUIESCE 选 项 ， 那 么 需要 采取 其 他 步骤 确保 恢复 的 一 致 点 。 例 如 ， 可 以 将 数据 库 对 象 设 为 只 读 模 式 ， 使 
数据 库 对 象 脱 机 或 停止 应 用 程序 进程 (至 少 是 更 新 相关 数据 库 对 象 [的 应 用 程序 进程 ) 。 


什么 时 候 创建 一 致 点 


如 果 可 能 ，DBA 应 该 在 日 常 处 理 过 程 中 创建 一 个 一 致 性 点 。 如 果 需 要 时 间 点 恢复 ， 一 致 点 可 以 派 上 用 场 。 在 以 下 情况 下 你 
应 该 考虑 创建 一 致 点 : 


DBA 应 该 在 日 常 处 理 过 程 中 创建 一 个 一 致 点 。 


“ 归档 活动 日 志 前 。 如 果 失 去 活动 上 日志， 你 需要 使 用 归档 日 志 恢 复 ， 你 可 以 放心 地 应 用 只 记录 了 最 后 恢复 点 的 日 志 。 如 果 在 
恢复 点 以 后 应 用 日 志 ， 最 终 可 能 会 导致 数据 不 一 致 。 如 果 活 动 日 志 不 自动 归档 ， 趣 载 活动 日 志 前 可 以 关闭 对 象 ， 这 样 可 以 一 直 使 
用 数据 而 不 会 有 不 一 致 的 状态 。 


* 复制 相关 的 数据 库 对 象 前 。 复 制 一 组 相关 表 之 前 考虑 创建 一 致 点 。 这 可 以 保证 所 有 相关 的 数据 库 对 象 的 映像 副本 备份 彼此 


创建 映像 副本 备份 后 。 制 作 映 像 副 本 备份 的 同时 在 线 数据 库 发 生变 更 ， 你 可 以 在 备份 完成 后 创建 一 个 一 致 点 ， 建 立 好 的 恢 


大 量 修改 数据 库 前 。 当 批 处 理 作 业 运 行 故障 ， 或 者 在 线程 序 工作 不 正常 时 ， 可 以 使 用 部 分 恢复 将 数据 恢复 到 更 新 活动 前 的 
状态 。 在 更 新 活动 前 建立 一 个 一 致 点 ， 可 以 一 直 恢 复 到 这 一 点 ， 且 在 大 量 更 新 活动 之 前 无 须 制作 映像 副本 备份 。 


“ 在 静默 时 间 内 。 在 大 量 活动 期 间 建立 一 致 点 可 能 是 破坏 性 的 。 当 数据 库 对 象 没 有 更 新 时 ，DBMS 必 须 建 立 一 个 时 间 点 。 静 
默 时 调度 QUIESCE， 可 以 避免 这 些 干扰 。 


四 在 映像 副本 备份 过 程 中 ， 有 些 恢 复 选 项 或 产品 可 以 在 数据 库 日 志 中 找到 安静 点 而 不 需要 静默 。 


16.3.6 “日 志 归 档 和 备份 


DBMSs 将 所 有 数据 库 变更 记录 到 一 个 日 志文 件 中 ， 该 文件 称 作 事务 日 志 或 数据 库 日 志 。 每 个 成 功 执行 并 提交 的 SQL 
INSERT、UPDATE 和 DELETE 语 名 都 要 写 入 日 志 记 录 。 通 过 使 用 数据 库 日 志 ， 可 以 审查 并 重建 或 撤销 每 一 次 数据 库 变更 。 

随 着 时 间 的 推移 和 数据 库 变更 数量 的 增长 ， 数 据 库 日 志 的 大 小 也 在 增加 。 记 录 当 前 正 写 入 数据 库 的 日 志 称 为 活动 日 志 。 当 活 
动 数据 库 日 志 填 满 时 ，DBMS 调 用 一 个 称 作 日 志 归 档 或 日 志 注销 加 载 的 过 程 。 当 数据 库 日 志 归 档 时 ， 当 前 活动 日 志 信息 脱 机 移 到 
归档 日 志文 件 ， 活 动 日 志 复位 。 如 果 信 息 不 能 写 入 活动 数据 库 日 志 ，DBMS 将 停止 对 数据 库 的 修改 ， 直 到 日 志 归 档 且 活动 日 志 


位 。 
通常 DBA 使 用 DBMS 配 置 参数 ， 来 控制 日 志 归 档 的 频率 。 大 多 数 DBMS 还 提供 了 一 个 命令 允许 DBA 手 动 请 求 日 志 归 档 。 请 记 
住 ， 每 个 DBMS 进 行 日 志 归 档 和 备份 的 方式 都 不 同 。 请 参阅 “SQL Server 事 务 日 志 备份 ”， 其 简单 讨论 了 事务 日 志 备份 。 
通常 DBA 控 制 日 志 归 档 的 频率 。 
SQL server 事 务 日 志 备份 


为 了 确保 Microsoft SQL Setrvet 数 据 库 的 高 效 和 有 效 的 备份 和 恢复 策略 ， 你 需 定 期 实施 事务 日 志 备份 。 使 用 BACKUP LOG 命 令 
创建 事务 日 志 备份 。 可 以 将 数据 库 恢复 到 已 备份 的 事务 日 志 序 列 中 的 任意 时 间 点 〈 直 到 故障 点 ) 。 如 果 在 出 现 故 障 之 前 ， 你 没有 
备份 事务 日 志 ， 就 只 能 将 数据 库 恢 复 到 上 一 次 创建 的 数据 库 备份 。 


当 Mictosoft SQL Setvet 完 成 了 备份 事务 日 志 时 ， 它 就 会 截断 日 志 的 非 活动 部 分 。 这 会 释放 事务 日 志 空 间 。SQL Server T AE 
用 这 个 截断 的 空间 ， 而 不 会 导致 事务 日 志 不 断 增长 并 消耗 更 多 的 空间 。 事 务 日 志 的 活动 部 分 包含 仍 在 运行 和 备份 时 尚未 完成 的 导 


务 。 


wy 


当 事 务 日 志 七 成 满 或 出 现 “ 日 志 已 满 ” HRM, Microsoft SQL Setrvet 将 设置 一 个 检查 点 。 此 外 ，SQL Servet 一 旦 关闭 (除非 


间 定 NOWAIT 选 项 ) ， 它 将 为 每 个 数据 库 设置 检查 点 。 


4e RTRUNC LOG ON CHKPT 数 据 库 选 项 设置 为 TRUE， 事 务 日 志 就 不 会 备份 。 如 果 指 定 TRUNC LOG ON CHKPTA 


真 ，Mictosoft SQL Servet 将 在 每 个 检查 点 清除 不 活跃 的 事务 日 志 条 目 。 这 个 选项 告诉 SQL Setrvet 不 使 用 事务 日 志 还 原 操 作 。 但 


是 ， 事 务 日 志 仍 然 需要 创建 ， 因 为 其 可 以 用 于 回 滚 事务 并 确定 SQL Servet 重 启 时 如 何 恢复 数据 库 。 检 查 点 日 志 截 断 仅 适用 于 在 一 
天 内 可 以 失去 某 些 事务 的 系统 。 因 为 你 能 够 将 数据 库 恢复 到 最 后 制作 的 数据 库 备份 中 。 这 种 性 质 的 应 用 程序 在 大 多 数 生产 环境 中 


是 罕见 的 。 


如 果 事务 日 志 已 截断 (BACKUP LOG 命 令 除外 ) ， 进 行 数据 库 备份 或 差异 数据 库 备 份 前 不 应 该 备份 上 日志。 差异 数据 库 备份 
只 备份 自 上 次 完整 数据 库 备份 以 来 发 生变 更 的 数据 。 


也 应 该 避免 备份 自 上 次 创建 数据 库 备 份 以 来 任何 无 日 志 记 录 操 作 的 事务 日 志 。 如 果 这 样 ， 还 不 如 创建 数据 库 备份 或 差异 数据 
库 备 份 。 


最 后 ， 如 果 有 任何 文件 添加 到 数据 库 或 从 数据 库 删 除 ， 不 应 该 进行 事务 日 志 备份 。 相 反 ， 应 该 建立 一 个 完整 的 数据 库 备 份 ， 


以 便 此 后 可 以 再 次 创建 事务 日 志 备份 。 


16.3.7 ”确定 备份 计划 
建立 合理 的 备份 时 间 表 ， 需 要 权衡 两 个 相互 竞争 的 需求 : 经 常 制作 映像 副本 备份 来 保证 合理 的 恢复 时 间 的 需求 ， 不 中 断 日 党 
业务 的 需求 。DBA 必 须根 据 使 用 标准 和 DBMS 功 能 ， 权 衡 这 两 个 目标 。 


并 不 是 所 有 数据 都 是 平等 的 。 一 些 数据 库 和 表 包 含 业务 必要 的 核心 数据 。 一 些 数据 库 对 象 包 含 不 太 重要 或 容易 从 其 他 来 源 获 
得 的 数据 。 建 立 可 行 的 备份 策略 和 时 间 表 之 前 ， 需 要 对 数据 库 和 数据 进行 分 析 ， 以 确定 其 性 质 和 对 业务 的 价值 。 要 做 到 这 一 点 ， 
对 每 个 数据 库 对 象 都 要 考虑 下 列 问题 : 


并 不 是 所 有 数据 都 是 平等 的 。 

` 针对 数据 的 日 常 活动 有 多 少 ? 

* 数据 变更 的 频率 如 何 ? 

数据 对 业务 的 重要 性 如 何 ? 

数据 可 以 轻易 地 重建 吗 ? 

“ 用 户 需要 什么 样 的 访问 ? 需要 24/7 的 访问 吗 ? 

` 恢复 时 数据 不 可 用 的 代价 是 多 少 ? 停机 一 分 钟 是 多 少 美元 ? 
根据 其 重要 性 和 波动 对 每 个 数据 库 对 象 进行 分 级 。 


根据 其 重要 性 和 波动 对 每 个 数据 库 对 象 进行 分 级 非常 有 帮助 。 这 可 以 使 用 图 16-2 中 所 示 来 实现 。 纵 轴 表 示 临 界 连 续 ， 范 围 
包括 从 很 容易 替换 的 数据 到 不 易 替 换 的 数据 。 横 轴 代 表 一 个 波动 范围 ， 从 很 少 变更 的 静态 数据 到 经 常 变 更 的 易 变 数据 。 通 过 估计 
其 相对 波动 性 和 对 企业 的 重要 性 ， 使 用 此 网 格 图 表示 每 个 数据 库 对 象 。 请 记 住 ， 这 些 术语 有 些 模 糊 ， 需 要 根据 你 对 数据 和 企业 的 
了 解 ， 对 数据 进行 分 析 并 定义 坐标 轴 。 


性 


r 
Pt 


i 


数据 重 


Co 


Fi 
要 


l 


3 


IAS 动态 
数据 波动 


图 16-2 ”数据 的 性 质 和 类 型 


一 旦 为 数据 库 对 象 绘制 了 图 表 ， 可 以 使 用 该 图 表 作为 每 个 数据 库 对 象 的 备份 频率 的 一 个 总 体 反映 。 根 据 网 格 图 的 建议 ， 负 责 
每 个 应 用 程序 的 DBA 必 须 为 各 种 不 同类 型 的 数据 备份 设置 阐 值 。 一 般 情况 下 ， 关 键 数 据 备份 的 频率 比 非 关 键 数据 高 ， 易 失 性 数 
据 备 份 的 频率 比 静 态 数据 高 。 但 是 ， 关 键 是 你 如 何 定 义 频繁 一 词 。 例 如 ， 一 些 公司 每 天 1000 次 更 新 可 能 频率 很 高 ， 而 在 其 他 公 
司 可 能 每 天 更 新 50000 也 不 够 频繁 。DBA 使 用 网 格 为 每 个 数据 库 对 象 确 定 适 当 的 备份 计划 。 备 份 的 方法 还 受用 户 访问 需要 的 影 
响 。 

网 格 中 的 象限 1 识别 企业 中 关键 /动态 的 数据 。 这 个 数据 对 你 的 业务 至 天 重要 ， 且 经 常 变更 。 因 此 ， 你 应 该 经 常 复 制 ， 以 便 能 
够 迅速 恢复 它 。 作 为 一 个 经 验 法 则 ， 数 据 应 至 少 每 天 备份 。 如 果 每 天 有 超过 20% 的 数据 变更 ， 一 定 要 进行 完整 备份 而 非 增 量 备 
份 。 

象限 2 代表 关键 、 但 静态 的 数据 。 即 使 日 常 的 数据 变更 不 大 ， 一 旦 发 生 错误 ， 需 要 迅速 恢复 数据 ， 因 为 它 对 业务 至 关 重 要 。 
确保 至 少 每 周 备份 这 些 数 据 。 考 虑 使 用 增 量 备份 ， 一 旦 完成 立即 合并 ， 尽 量 减少 恢复 过 程 所 需 的 工作 。 


象限 3 代表 对 你 的 业务 不 至 关 重 要 且 不 稳定 的 数据 。 如 果 损坏 ， 它 还 能 够 重建 。 根 据 数 据 量 和 体积 的 变化 ， 你 甚至 可 以 不 备 
份 。 对 于 少量 的 数据 ， 打 印 出 的 报告 足以 作 备份 。 如 果 数 据 失效 ， 可 以 很 容易 从 打印 的 报告 中 重新 获得 这 些 数 据 。 如 果 夜 间 批 处 
理 作 业 中 的 数据 重建 ， 运 行 批 处 理 作业 刷新 数据 即 可 。 作 为 一 名 DBA， 你 需要 确保 数据 可 以 定期 重建 或 复制 。 一 般 情 况 下 ， 象 
限 3 的 数据 每 星期 备份 都 有 些 过 分 。 


象限 4 指 静 态 的 、 非 关键 数据 。 这 样 的 数据 并 没有 太 大 的 变更 ， 很 容易 替换 。 它 是 最 不 重要 的 数据 ， 在 其 他 三 个 象限 的 数据 
都 充分 备份 了 以 后 才 处 理 它 。 事 实 上 ， 象 限 4 中 的 数据 可 能 永远 不 需要 备份 ，DBA 对 它 可 以 采取 类 似 象限 3 所 述 的 方法 。 


16.3.8 “DBMS 实 例 备份 


除了 准备 应 对 单个 数据 库 对 象 的 失败 ，DBA 必 须 做 好 准备 恢复 整个 DBM 实例 或 子 系统 故障 。 请 务必 备份 所 有 数据 库 实 例 的 
关键 组 成 部 分 ， 包 括 DBMS 文 件 、 系 统 目 录 和 目录 对 象 、 数 据 库 (归档 ) 日 志 、 配 置 和 设置 文件 、 系 统 库 、 磁 带 管 理 库 、 源 程序 
库 、 可 执行 文件 库 。 当 然 ， 当 为 DBMS 实 例 规划 恢复 策略 时 ， 每 个 DBMS 和 平台 必须 要 处 理 的 关键 组 成 部 分 都 不 相同 。 


准备 恢复 整个 DBMS 实 例 或 子 系统 故障 。 


恢复 整个 数据 库 实 例 比较 少见 ， 但 不 可 以 忽略 不 计 。DBM 实例 设备 故障 有 不 同 的 原因 ， 如 设备 失败 ( 当 关 键 DBMS 组 件 驻 
留 在 该 设备 上 时 ) 、 一 个 拙劣 的 版 本 升级 或 人 为 错误 (删除 关键 文件 ) 。 


在 某 些 可 怕 的 情况 下 ， 为 了 恢复 一 个 DBMS 组 件 ， 你 可 能 需要 诉 诸 原 来 的 安装 介质 。 当 然 ， 从 原来 的 介质 还 原 ， 你 可 能 不 会 
应 用 任何 后 续 的 缺陷 修复 。 因 此 ， 恢 复 过 程 应 重新 应 用 DBMS 供 应 商 提 供 的 修复 。 


从 DBMS 实 例 故 障 中 恢复 是 一 个 非常 复杂 的 过 程 。 当 规划 备份 和 恢复 策略 时 ， 请 务必 参阅 DBMS 提 供 的 文档 ， 确 保 要 备份 所 
有 必要 的 数据 。 此 外 ， 重 读 手册 ， 然 后 再 尝试 DBMS 实 例 恢复 ， 没 有 彻底 了 解 恢 复 的 原因 ， 就 不 要 尝试 恢复 DBMS 实 例 。 


16.3.9 ”设计 恢复 的 DBMS 环 境 


为 了 使 恢复 过 程 更 容易 ， 你 应 该 始终 利用 DBMS 的 功能 。 例 如 ， 大 多 数 DBMS 提 供 分 配 匈 余数 据 库 日 志 的 选项 。 一 定 要 利用 
这 一 选项 。 始 终 分 配 (BD) 两 个 活动 数据 库 日 志文 件 到 单独 的 磁盘 控制 器 、 磁 盘 通 道 和 磁盘 卷 。 通 过 彼此 分 开 的 双 副 本 ， 你 可 
以 预防 磁盘 卷 故障 。 如 果 一 个 活动 数据 库 日 志 的 副本 丢失 或 损坏 ， 那 么 可 以 使 用 其 他 副本 继续 操作 。 


16.3.10 ”数据 库 备 份 的 茶 代 途径 


到 目前 讨论 的 备份 方法 涉及 将 数据 库 对 象 的 物理 数据 文件 逐 字 (或 几乎 一 字 不 差 ) 复制 到 一 个 备份 设备 。 这 种 映像 副本 备份 
提供 了 一 种 快速 数据 备份 的 方法 ， 恢 复 过 程 中 比较 容易 使 用 。 


备份 存储 在 数据 库 中 数据 的 首选 方法 是 使 用 DBM 提供 的 实用 程序 和 方法 。 但 也 可 以 使 用 其 他 方法 。 应 将 这 些 方法 视 为 特殊 
程序 ， 只 能 在 某 些 情况 下 使 用 。 


使 用 数据 库 导 出 创建 逻辑 备份 


数据 库 恢 复 的 另 一 种 方法 是 导出 或 纯 载 存 储 在 数据 库 对 象 中 的 数据 。 有 时 仅 备 份 数据 而 不 是 整个 物理 文件 的 过 程 称 为 好 辑 备 
份 。 如 下 面 的 示例 ， 部 署 逻 辑 备份 非常 有 用 : 


.对象 或 行 恢 复 。 如 果 有 人 无 意 中 删 除了 一 个 表 或 从 表 中 删除 几 行 ， 从 物理 备份 中 恢复 可 能 会 很 困难 。 使 用 逻辑 备份 ， 丢 失 
的 数据 可 以 简单 地 重新 加 载 到 表 中 。 


.DBMS 的 版 本 升级 。 有 时 为 了 版 本 迁移 ，DBMS 供 应 商 改 变 底 层 的 数据 库 结 构 。 当 这 种 情况 发 生 时 ， 使 用 可 以 导入 新 的 版 
本 的 逻辑 备份 很 有 用 ， 而 不 是 试图 将 现 有 的 结构 (数据 以 及 所 有 ) 转换 成 新 的 格式 。 


. 异 构 数据 库 迁 移 。 不 同 平台 的 物理 数据 结构 有 所 不 同 ， 即 使 使 用 相同 的 DBMS。 例 如 ，OS/390 上 的 Oracle 数 据 库 与 
Windows NT 上 实施 的 相同 Oracle 数 据 库 ， 使 用 的 物理 文件 结构 就 不 相同 。 逻 辑 备份 可 用 来 方便 不 同 平台 的 不 同 数据 库 之 间 的 数据 
移动 。 


. 数据 移动 。 数 据 (一 旦 在 数据 库 中 创建 ) 将 在 全 企业 范围 (或 许 不 同 的 DBMS、 平 面 文件 、 电 子 表格 ) 内 移动 和 转移 。 只 
ZER, SHED (因为 仅 是 数据 ) 可 以 使 那些 数据 的 移动 更 容易 。 


逻辑 备份 与 数据 库 的 建立 和 运行 相关 ， 因 此 对 性 能 的 影响 ， 只 是 通 
名 DBA， 你 必须 记 住 逻 辑 备份 数 据 的 完整 性 。 虽 然 DBM 将 使 用 它 的 锁 
非 在 数据 导出 过 程 中 停止 并 发 活动 。 


过 事务 及 其 他 生产 程序 对 数据 的 并 发 访问 。 然 而 ， 作 为 一 
定 机 制 来 确保 数据 的 一 致 性 ， 却 无 法 保证 参照 完整 性 ， 除 


使 用 逻辑 备份 完成 物理 备份 策略 。 
定期 创建 逻辑 备份 ， 可 以 避免 物理 备份 策略 的 不 足 。 
使 用 存储 管理 软件 进行 备份 


存储 管理 软件 可 以 用 来 备份 管理 存储 设备 上 的 文件 。 有 些 DBM S 与 特定 的 存储 管理 软件 交互 ， 例 如 ，IBM DFSMS 备 份 可 以 
与 DB2 映 像 副 本 备份 交互 。 此 外 ，EMC 和 其 他 SAN 供 应 商 启 用 了 SAN 复 制 ， 它 已 由 一 些 公司 用 作 数 据 库 备 份 的 补充 。 


当 使 用 存储 管理 软件 来 备份 DBMS 控 制 范围 之 外 的 数据 库 对 象 时 ， 一 定 要 禁用 正在 备份 的 所 有 数据 库 对 象 的 数据 库 写 操作 。 
要 做 到 这 一 点 ， 使 用 DBMS 命 令 停 止 数据 库 对 象 ， 或 者 在 只 读 模 式 启用 它们 。 一 旦 数据 库 修改 操作 暂停， 存储 管理 软件 可 用 于 备 
份 数 据 库 对 象 。 当 备份 完成 时 ， 使 用 DBMS 命 令 重 启 数据 库 对 象 的 读 / 写 模式 。 


一 定 要 完全 了 解 存储 管理 软件 和 DBMS 的 功能 。 例 如 ， 一 些 存 储 管理 软件 无 法 复制 打开 的 文件 。 但 是 ， 如 果 DBMS 正 在 使 用 
它们 ， 包 含 数 据 库 数据 的 文件 是 可 以 打开 的 。 不 了 解 这 些 细节 可 能 会 导致 备份 丢失 和 数据 不 可 恢复 。 


此 外 ， 当 需要 恢复 时 ， 应 该 使 用 存储 管理 软件 ， 而 不 是 DBMS 实 用 工具 或 命令 。 由 存储 管理 软件 制作 的 备份 ， 其 格式 很 可 能 
仅 适 用 于 制作 它 的 软件 。 


16.3.11 “记录 备份 策略 


一 旦 备份 策略 建立 和 实施 ， 备 份 系统 就 可 以 运行 很 长 一 段 时 间 ， 不 需要 DBA 任 何 干预 。 但 是 这 种 自动 化 喜忧参半 。 随 着 时 
间 的 推移， 有 些 事情 会 遗忘 ， 并 且 DBA 人 员 也 可 能 更 换 ， 这 两 种 情况 在 繁忙 的 数据 库 恢复 过 程 都 可 能 会 导致 混乱 。 因 此 ，DBA 
必须 对 备份 和 恢复 策略 、 实 施 和 程序 进行 彻底 的 测试 和 记录 。 


任何 备份 计划 中 最 重要 的 方面 ， 是 在 测试 环境 中 彻底 测试 每 个 不 同类 型 的 恢复 。 确 保 你 可 以 从 介质 故障 、 实 例 故 障 和 几 种 类 
型 的 应 用 程序 故障 中 恢复 。 记 录 每 个 数据 库 对 象 的 备份 类 型 ， 以 及 每 个 备份 的 时 间 表 。 一 定 要 确保 所 有 的 数据 库 可 以 恢复 ， 并 且 
所 有 在 场 的 DBA 都 要 亲身 体验 数据 库 恢复 。DBA 组 应 安排 对 每 一 个 生产 数据 库 的 备份 和 恢复 计划 进行 定期 评估 。 


安排 定期 评估 每 一 个 生产 数据 库 的 备份 和 恢复 计划 。 


16.3.12 ”数据 库 对 象 定义 备份 


除了 定期 备份 数据 ，DBA 还 应 该 考虑 定期 备份 数据 库 对 象 定 义 。 数 据 库 对 象 定义 也 会 因 参 数 的 修改 而 发 生 改 变 。 如 果 不 小 
心 删除 了 某 个 对 象 ， 却 没有 维护 用 于 创建 和 变更 对 象 的 DDL 记 录 ， 会 怎么 样 ?答案 是 ， 重 建 和 以 前 一 样 的 对 象 非常 困难 。 


DB2 为 Linux、UNIX 和 Windows 都 提供 DB2LOOK 实 用 程序 来 做 到 这 一 点 ，Oracle 提 供 了 导出 实用 程序 。 如 果 你 使 用 的 


DBMS 不 提供 这 样 的 实用 工具 ， 可 以 从 DBMS 系 统 目 录 中 得 到 数据库 对 象 的 信息 。 建 议 考虑 从 系统 目录 中 生成 定期 报告 ， 详 细 说 
明生 产 环境 中 的 每 个 数据 库 对 象 的 具体 参数 和 选项 。 


数据 库 对 象 定义 可 以 随时 间 而 改变 。 


你 也 许 能 够 针对 可 以 生成 实际 DDL 语 句 的 系统 目录 创建 SQL 查询 ， 这 些 语句 可 以 根据 需要 重新 运行 。 例 如 ， 考 虑 下 列 伪 SQL 
查询 : 


SELECT "CREATE DATABASE " 


" STOGROUP " 
FROM 


, dbname, " BUFFERPOOL " 
sysdatabases; 


bpname 
sgname, " Sij ' 
, ’ 


DB2 的 DBA 不 得 不 删除 分 区 表 空间 ， 而 重建 更 少 的 分 区 。 试 图 通过 更 改 表 空间 而 删除 一 些 分 区 是 行 不 通 的 。 变 更 以 后 ， 锁 定 问题 
的 发 生机 率 增 大 。 笠 运 的 是 ， 变 更 之 前 DBA 保 存 了 表 空 间 的 定义 。 在 这 种 情况 下 ， 原 来 的 锁定 大 小 为 行 ， 而 当前 锁定 大 小 是 页 
面 。 将 表 空 间 重 新 设置 成 行 锁定 ， 这 个 问题 就 解决 了 。 但 是 ， 如 果 没 有 原来 的 定义 ， 问 题 可 能 就 不 会 这 么 容易 跟踪 和 解决 。 


此 SQL 查询 根据 系统 目录 中 的 元 数据 创建 SQL CREATE 语 句 。 为 什么 这 一 信息 很 重要 ”考虑 这 个 悲哀 的 故事 : 使 用 大 型 机 


16.4 恢复 


当 问 题 影 响 数据 库 时 ，DBA 可 以 使 用 映像 副本 备份 和 数据 库 日 志 来 恢复 数据 库 。 不 管 什么 原因 ，DBA 必 须 能 够 快速 恢复 数 
据 而 不 影响 业务 的 进行 。 


如 果 数 据 不 可 用 ， 你 的 公司 可 能 会 因此 失去 十 万 甚 全 上 上 百 万 美元 。 仪 认识 到 数据 库 恢 复 的 重要 性 还 不 
够 ， 还 必须 能 够 以 迅速 而 妥善 的 方式 实际 执行 恢复 。 数 据 库 恢复 是 一 项 非常 复杂 的 任务 ， 容 易 出 错 且 难 以 管理 。 


数据 库 恢 复 是 一 项 非常 复杂 的 任务 。 


恢复 不 仅 涉及 将 数据 还 原 到 一 些 较 早 的 时 间 点 。 还 涉及 使 数据 回 到 问题 发 生 时 (或 之 前 ) 的 状态 。 恢 复 通常 需要 恢复 数据 
库 ， 然 后 以 正确 的 顺序 重新 应 用 该 数据 库 所 发 生 的 正确 变更 。 


简单 地 说 ， 成 功 的 恢复 是 通过 恢复 使 应 用 程序 数据 可 以 回 到 你 想 要 的 状态 。 不 管 这 个 状态 是 上 周 、 昨 天 还 是 不 久之 前 。 如 果 
备份 策略 得 当 ， 那 么 你 应 该 能 够 从 几乎 任何 类 型 的 故障 中 恢复 。 


16.4.1 ”确定 恢复 选项 


当 故 障 发 生 时 ， 作 为 一 名 DBA， 你 需要 做 的 是 : 确定 是 否 需 要 恢复 。 如 果 需 要 恢复 ， 你 就 要 确定 什么 样 的 资源 (备份 副 
本 ) 可 用 ， 以 及 如 何 更 好 地 执行 恢复 。 你 需要 考虑 下 面 几 个 问题 ， 来 确定 故障 的 类 型 和 程度 。 你 的 答案 决定 了 恢复 系统 所 采取 的 
步骤 。 


.发生 了 什么 类 型 的 故障 : 介质 、 事 务 处 理 或 数据 库 实 例 ? 


“ 故障 的 原因 是 什么 ? 


- 数据 库 是 如 何 出 现 故 障 的 : 中 止 、 死 机 、 正 常 关机 ? 


- 是 否 有 任何 操作 系统 发 生 错 误 ? 


“ 服务 器 是 否 进 行 了 重新 启动 ? 


操作 系统 日 志 是 否 有 任何 错误 ? 


BRA EY REALE BR? 


ATERT FEE XIE? 


- 是 否 生成 任何 跟踪 文件 ? 


“ 丢失 数据 的 重要 性 如 何 ? 


“ 至 今 你 有 没有 尝试 任何 形式 的 恢复 ? 如 果 有 ， 进 行 了 什么 样 的 步骤 ? 


- 存在 哪些 类 型 的 备份 : 完整 、 增 量 或 二 者 兼 而 有 之 ? 


* 哪些 数据 需要 恢复 : 完整 的 数据 库 、 表 空间 、 单 个 表 、 索 引 或 以 上 所 有 的 组 合 ? 


ps 


* 你 的 备份 策略 是 否 支持 恢复 (恢复 到 当前 与 时 间 点 ) 的 类 型 ? 


" 如 果 进 行 了 冷 备份 ， 冷 备份 时 数据 库 是 如 何 关闭 的 ? 


“ 所 有 的 归档 数据 库 日 志 是 否 可 用 于 恢复 ? 


. 你 最 近 有 没有 进行 逻辑 备份 (EXPORT 或 UNLOAD) ? 


当 系 统 崩 演 时 ， 有 哪些 并 发 活动 正在 运行 ? 


“ 你 能 恢复 DBMS 实 例 吗 ? 


.数据库 对 象 可 以 访问 吗 ? 


- 系统 的 可 用 性 需求 是 什么 ? 


: 有 多 少数 据 是 必须 恢复 的 ? 


+ 你 使 用 的 是 原始 文件 吗 ? 
此 外 ，DBMS 版 本 迁移 也 可 以 对 可 恢复 性 产生 影响 。 例 如 ， 考 虑 以 下 事件 序列 : 
. 运行 DBMS 第 10 版 的 同时 ， 制 作 TableA 的 备份 副本 。 
- DBMS 迁 移 到 一 个 新 的 版 本 ， 如 第 11 版 。 
. 遇 到 一 个 问题 ，TableA 需 要 恢复 。 


根据 DBMS 和 新 版 本 的 具体 情况 ，TableA 可 能 无 法 恢复 。 有 时 DBM Ss 供应 商 改 变 映像 副本 备份 文件 的 格式 ， 致 使 旧 格 式 的 
任何 备份 都 无 法 使 用 。 日 志文 件 同样 如 此 ， 格 式 可 能 已 经 因 某 个 新 版 本 而 发 生 了 改变 ， 致 使 昌 的 日 志文 件 不 可 读 ， 因 此 数据 也 无 
法 恢复 。 也 许 新 版 本 中 RECOVER 实 用 程序 的 功能 变 了 ， 和 致使 它 不 能 读 取 旧 的 备份 文件 。 在 这 两 种 情况 下 ，DBA 都 无 计 可 施 ， 
为 没有 有 效 的 备份 可 用 于 恢复 。 由 于 这 些 原因 ， 迁 移 之 前 确保 调查 每 个 DBM 新 版 本 的 备份 和 恢复 的 详细 情况 ， 迁 移 后 如 果 旧 的 
备份 无 法 使 用 ， 考 虑 制作 新 的 映像 副本 备份 。 


迁移 之 前 确保 调查 每 个 DBMS 新 版 本 的 备份 和 恢复 的 详细 情况 。 


当然 ， 这 只 是 DBA 有 效 恢复 数据 库 对 象 必须 要 考虑 的 一 些 问题 。 此 外 ，DBA 需 要 了 解 在 用 的 DBMS 的 所 有 细节 。 例 
如 ，Oracle 回 滚 段 的 信息 ， 或 如 何 识 别 一 个 特定 的 用 于 DB2 恢 复 的 日 志 RBA (相对 字 节 地 址 ) 。 


当 使 用 Microsoft SQL Server 时 ，DBA 可 以 从 几 个 恢复 模式 中 选择 一 个 用 于 数据 库 实现 。 更 多 细节 ， 请 参阅 “SQL Server 
恢复 模式 ”。 


SQL Server 恢 复 模 式 


当 创 建 数据 库 的 备份 和 恢复 计划 时 ，SQL Server 的 DBA 可 以 选择 恢复 模式 。 恢 复 模式 的 恢复 选项 基于 性 能 、 事 务 日 志 存 储 和 
容错 要 求 。 有 三 种 恢复 模式 : 简单 恢复 、 完 全 恢复 和 大 容量 日 志 恢 复 。 


简单 恢复 需要 较 少 的 日 志 空间 ， 但 丢失 数据 的 可 能 性 最 大 。 使 用 简单 恢复 ， 只 有 完整 和 差异 备份 可 用 于 恢复 。 


完全 恢复 记录 了 一 切 操作 ， 用 额外 的 日 志 空间 换取 了 更 全 面 的 恢复 方法 。 使 用 完全 恢复 ，DBA 可 以 使 用 事务 日 志 执行 时 间 


最 后 ， 大 容量 日 志 恢 复 对 批量 操作 进行 了 优化 ， 在 三 个 选项 中 它 的 性 能 最 佳 。 批 量 操作 包括 BCP 执 行 、SELECT INTO、 上 索 
引 的 创建 、 文 本 更 新 和 写 入 。 大 容量 日 志 恢复 不 支持 时 间 点 的 恢复 。 


SQL Servef 的 DBA 可 以 从 这 些 模式 中 选择 最 能 微调 他 们 生产 数据 库 备份 和 恢复 操作 的 模式 。 


16.4.2 ”数据 库 对 象 恢复 的 一 般 步骤 


从 较 高 层次 来 看 ， 下 面 是 大 多 数 数据 库 恢复 的 常见 步 又: 


1. 识 别 故 障 。 中 断 的 检测 通常 很 简单 : 无 论 数据 库 没有 响应 应 用 程序 ， 或 者 DBMS 显 示 某 类 错误 消息 。 但 有 些 问题 比较 隐 
蔽 ， 如 控制 文件 的 破坏 。 这 类 问题 需要 更 多 的 技巧 来 识别 。 


2. 分 析 情况 。DBA 必 须 分 析 错 误 ， 来 确定 故障 的 原因 、 类 型 和 沱 围 。 在 这 个 分 析 结 果 的 基础 上 ，DBA 将 选择 合适 的 恢复 方 


法 。 这 通常 是 恢复 任务 中 最 耗 时 的 。 


3. 确 定 哪些 数据 需要 恢复 。DBA 必 须 确 定 哪些 数据 库 对 象 (也 许 还 有 其 他 组 件 如 日 志 ) 出 现 故障 ， 并 准备 适合 每 个 组 件 的 恢 
复 脚 本 。 这 项 操作 也 会 消耗 大 量 时 间 ， 特 别 是 对 于 较 大 的 系统 。 


4. 确 定 要 恢复 的 数据 库 对 象 之 间 的 依赖 关系 。 一 个 数据 库 对 象 的 故障 可 能 会 影响 其 他 数据 库 对 象 〈 例 如， 索引 和 引用 相关 的 
表 ) 。 数 据 丢 失 或 恢复 到 以 前 的 时 间 点 很 可 能 会 影响 相关 的 数据 库 对 象 。 


5. 找 到 所 需 的 映像 副本 备份 。 映 像 副本 备份 越 接近 恢复 的 时 间 点 ， 恢 复 花 费 的 时 间 就 越 短 。 请 考虑 其 他 因素 ， 如 从 磁带 库 中 
找到 磁带 所 花费 的 时 间 ， 磁 带 也 可 能 在 异地 。 


6. 还 原 映 像 副本 备份 。 使 用 数据 库 恢复 工具 或 文件 系统 恢复 命令 来 完成 恢复 。 
7. 通 过 数据 库 的 日 志向 前 滚动 。 制 作 映 像 副 本 备份 以 后 ， 恢 复 到 当前 或 某 个 时 间 点 ， 需 要 对 数据 库 日 志 进 行 处 理 。 
基本 上 ， 每 个 数据 库 恢 复 将 涉及 以 上 7 个 步骤 。 然 而 ， 根 据 情况 和 恢复 请 求 的 不 同 ， 某 些 步骤 可 能 需要 去 掉 或 进行 改变 。 


Bera 


16.4.3 “恢复 的 类 型 


当 需 要 处 理 某 种 灾难 时 ， 在 所 有 执行 的 不 同 恢复 类 型 中 ， 通 常 最 先 想到 的 是 恢复 到 当前。 灾难 可 能 是 任何 东西 ， 可 以 是 介质 


BGA 


故障 ， 也 可 以 是 自然 灾害 摧毁 了 一 个 数据 中 心 。 恢 复 完 成 前 ， 应 用 程序 是 不 可 用 的 。 图 16-3 摘 述 了 这 一 过 程 。 


~ 
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= We 
正常 事务 故障 
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"A 
时 间 轴 A A i 一 


A ! H 回复 开始 


Fi y 恢复 到 当前 ， 解 决 介 使 故障 


图 16-3 ”恢复 到 当前 


第 一 种 恢复 类 型 是 恢复 到 当前 。 


要 成 功 恢复 中 断 ， 恢 复 过 程 必须 能 够 重 置 数据 库 的 内 容 ， 使 它 看 起 来 刚好 处 于 (或 稍微 早 于 ) 故障 点 。 要 恢复 中 断 ， 恢 复 过 


程 必须 找到 有 效 的 、 完 整 的 映像 副本 备份 ， 并 恢复 该 映像 副本 。 然 后 恢复 将 通过 数据 库 日 志向 前 滚动 ， 应 用 所 有 数据 库 的 变更 。 


如 果 最 新 的 完整 映像 副本 丢失 或 破坏 ， 只 要 人 存在 以 前 的 映像 副本 ， 恢 复 仍 然 可 以 进行 。 恢 复 过 程 开 始 时 可 能 使 用 旧 的 备份 副 
本 ， 然 后 应 用 任何 增 量 副本 ， 并 通过 归档 和 活动 日 志向 前 滚动 。 当 然 ， 这 种 情况 需要 的 数据 库 日 志 更 多 ， 所 以 恢复 过 程 也 更 长 。 


如 果 开 始 时 没有 映像 副本 ， 可 以 只 使 用 数据 库 日 志 来 恢复 数据 库 对 象 。 如 果 加 载 了 数据 ， 且 将 这 一 过 程 记录 下 来 ， 那 么 只 需 
要 通过 应 用 日 志 记 录 进 行 恢复 。 


另 一 种 传统 的 恢复 类 型 是 时 间 点 (PIT) 恢复 ， 通 常用 于 处 理应 用 程序 级 别 的 问题 。PIT 恢 复 有 时 也 称 为 评分 恢复 ， 因 为 恢复 
后 现 有 的 数据 只 有 一 部 分 会 保留 。 恢 复 到 某 个 时 间 点 ， 删 除 指定 时 间 点 以 后 发 生 的 所 有 事务 。 


恢复 到 某 个 时 间 上 点， 删除 指定 时 间 点 以 后 发 生 的 所 有 事务 。 


要 执行 PIT 恢复 ， 就 要 恢复 映像 副本 备份 ， 然 后 通过 数据 库 日 志 (或 日 志 备份 ) 向 前 滚动 来 应 用 变更 。 然 而 ， 只 可 以 使 用 截 
至 指定 时 间 的 日 志 记录 。 有 时 将 恢复 点 指定 为 一 个 实际 的 日 期 和 和 时间， 有 时 使 用 数据 库 日 志 的 相对 字 节 地 址 来 指定 。 时 间 点 的 恢 
复 过 程 如 图 16-4 所 示 。 
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图 16-4 ”时 间 点 恢复 过 程 


要 成 功 恢复 到 某 个 时 间 点 ， 恢 复 必 须 能 够 重 置 数据 库 的 内 容 ， 使 其 看 起 来 和 以 前 一 致 。 关 键 是 要 保留 所 有 成 功 的 数据 变更 ， 
同时 删除 所 有 失败 的 变更 。 以 上 描绘 的 PIT 恢 复 可 以 用 两 种 方式 实现 ， 这 取决 于 DBMS 的 功能 和 要 恢复 的 数据 量 。 它 可 以 


. 通过 日 志和 应 用 数据 库 变 更 到 恢复 点 向 前 滚动 来 还 原 映像 副本 。 
. 或 者 不 还 原 映像 副本 ， 而 是 向 后 滚动 ， 通 过 日 志 并 删除 恢复 点 之 后 发 生 的 数据 库 变更 。 


如 果 DBMS 支 持 这 两 种 类 型 的 恢复 ，DBA 应 该 选择 部 署 创建 停机 时 间 更 少 的 恢复 类 型 。 如 果 需 要 删除 的 变更 很 多 ， 恢 复 和 向 
前 滚动 通常 会 导致 更 短 的 停机 时 间 。 如 果 必 须 删 除 的 变更 很 少 ， 向 后 滚动 通过 日 志 应 该 导致 更 短 的 停机 时 间 。 很 少 有 DBMS 支 持 
向 后 日 志 滚 动 ， 但 有 些 第 三 方 产品 可 以 使 这 种 技术 变 得 可 行 。 


不 管 采用 什么 方法 来 执行 PIT 恢复 ，DBA 必 须 选 择 一 个 恢复 点 ， 这 个 点 代表 数据 是 一 致 的 。 一 致 的 恢复 点 可 以 保证 数据 的 完 
整 性 、 参 照 完整 性 和 事务 完整 性 。 有 些 DBMS 提 供 QUIESCE 实 用 程序 实现 了 一 致 性 点 ， 而 其 他 DBMS 则 需要 在 映像 复制 过 程 中 


(或 在 只 读 模 式 ) 停止 数据 库 对 象 。 


另 一 个 问题 是 确定 在 异常 事务 或 故障 之 后 ， 究 竟 执 行 了 什么 操作 。DBA 可 以 检查 作业 进度 ， 根 据 数据 库 日 志 生 成 报告 (如 
果 DBMS 提 供 了 实用 程序 来 生成 这 样 的 报告 ) ， 审 查 计算 机 控制 台 消息 ， 来 帮助 确定 在 故障 发 生 后 


运行 了 哪些 进程 。 
事务 恢复 是 第 三 种 类 型 的 恢复 ， 它 解决 了 传统 恢复 类 型 的 缺点 : 停机 时 间 和 丢失 正常 数据 。 因 此 ， 事 务 恢复 是 一 个 应 用 程序 
恢复 ， 即 从 数据 库 中 删除 指定 时 间 帧 的 特定 事务 的 影响 。 执 行事 务 恢复 需要 用 到 第 三 方 软件 。 
执行 


事务 恢复 需要 用 到 第 三 方 软件 。 


传统 类 型 的 恢复 (包括 恢复 到 当前 和 PIT) 都 是 在 数据 库 对 象 级 别 的 恢复 。 与 这 个 级 别 的 粒度 形成 直接 对 比 的 是 ， 事 务 恢复 
根据 用 户 定义 的 标准 允许 用 户 恢复 数据 库 的 特定 部 分 。 它 可 以 在 事务 或 应 用 程序 级 别 进行 。 这 种 情况 下 ， 根 据 用 户 对 过 程 的 理解 
来 定义 事务 。 这 可 能 构成 了 新 员工 操作 的 一 组 面板 ， 或 发 布 到 总 账 的 作业 组 。 关 键 是 ， 你 试图 修复 的 事务 和 DBMS 中 的 事务 (或 
恢复 单元 ) 之 间 是 否 可 能 存在 相关 性 。 


用 户 级 事务 定义 的 例子 有 : 


- 自 上 周三 上 午 11: 50 开 始 ， 由 用 户 ID DSGRNTLD 执 行 的 所 有 数据 库 更 新 。 
- 自 昨 天 下 午 8: 00 开 始 ， 由 名 为 PAYROIL 的 应 用 程序 执行 的 所 有 数据 库 删除 。 
在 应 用 程序 级 别 ， 可 能 会 发 生 任何 以 下 问题 : 
+ 程序 或 数据 库 的 编辑 检查 没有 正确 定义 ， 或 包含 错误 。 
有 人 改 了 作业 调度 软件 ， 或 没有 检查 有 效 的 完成 代码 ， 因 此 某 些 过 程 打 破 了 运行 顺序 ， 造 成 数据 问题 。 
. 未 经 充分 验证 的 代码 用 于 生产 。 
- 系统 软件 中 有 缺陷 。 
或 者 ， 可 能 不 会 有 问题 ， 但 你 需要 针对 相同 的 数据 多 次 运行 同一 个 程序 。 有 时 (特别 是 在 测试 和 系统 测试 环境 中 ) ， 当 你 要 
进行 一 项 测试 时 ， 然 后 回 滚 结果 再 进行 一 次 (一 人 遍 又 一 遍 ) 。 


一 旦 确定 了 要 恢复 事务 ， 有 三 个 恢复 选项 : 


“PIT 恢复 。 你 可 以 尝试 找 出 所 有 受 应 用 程序 影响 的 数据 库 对 象 ， 并 执行 传统 的 时 间 点 恢复 ， 以 删除 事务 的 影响 。 然 后 ， 手 
动 重新 运行 或 重新 进入 有 效 的 工作 。 


-UNDO 恢 复 。 仅 删除 异常 事务 的 影响 。 


-REDO 人 恢复。 删除 给 定 的 时 间 点 之 后 的 所 有 事务 ， 然 后 只 重 做 正常 的 事务 。 


PIT 恢复 前 面 已 经 讨论 过 ， 这 里 不 再 乾 述 。 其 他 两 种 事务 恢复 是 基于 SQL 的 应 用 程序 恢复 技术 。 基 本 思路 是 读 取 日 志 ， 并 生 
成 正确 的 可 运行 的 SQL 语句 ， 来 实现 所 需 的 恢复 结果 。 


首先 ， 来 看 UNDO 恢 复 。UNDO 恢 复 是 最 简单 的 基于 SQL 的 事务 恢复 ， 因 为 它 只 涉及 SQL。 要 实现 UNDO 恢 复 ， 必 须 扫描 数 
据 库 日 志 用 于 已 识别 的 事务 ， 并 生成 anti-SQL。anti-SQL 通 过 以 下 过 程 来 删除 SQL 的 影响 : 


UNDO 恢 复 是 最 简单 的 基于 SQL 的 事务 恢 


复 。 


“ 插入 转换 为 删除 。 
- 删除 转换 为 插入 。 
- 反 转 更 新 的 值 (例如 ， 将 “A”UPDATE 为 “X”， 变 为 将 “K” UPDATEA “A” ) 。 


一 旦 生成 anti-SQL， 就 可 以 使 用 交互 式 的 SQL 脚本 来 执行 UNDO 恢 复 ， 如 图 16-5 所 示 。 不 需要 恢复 的 数据 库 部 分 保持 不 
。 当 撤销 错误 的 事务 时 ， 可 以 进行 在 线 恢 复 ， 不 需要 受 应 用 程序 或 数据 库 中 断 的 影响 。 事 实 上 ， 要 运行 anti-3SQL， 必 须 启 用 
和 运行 DBMS。 然 而 ，UNDO 恢 复 期 间 ， 可 能 需要 撤销 某 些 应 用 程序 ， 从 而 消除 数据 异常 引起 的 其 他 故障 的 潜在 影响 。 


正常 事务 1 正常 事务 2 
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生成 UNDO SQL 恢复 开始 


Ss 应 用 UNDO SQL 


图 16-5 UNDO 恢 复 过 程 


但 是 ，REDO 恢 复 是 PIT 恢复 和 UNDO 恢 复 的 组 合 。REDO 恢 复 不 是 对 希望 消除 的 异常 事务 生成 SQL， 而 是 对 我 们 要 保存 的 事 
务 生成 SQL。 然 后 执行 标准 的 时 间 点 恢复 来 删除 恢复 点 之 后 的 所 有 事务 ， 最 后 ， 重 新 应 用 第 一 步 捕获 的 正常 事务 。 这 个 过 程 如 图 
16-6 所 示 。 


正常 事务 1 正常 事务 2 正常 事务 2 


1. 生成 REDO SQL 恢复 开始 
2. 时 间 点 恢复 ， 恢 复 到 异常 事务 之 前 的 某 个 静默 时 间 点 3. 应 用 REDO SQL 


A166 REDO 恢 复 过 程 


不 同 于 UNDO 过 程 ， 创 建 SQL 语句 删除 所 有 的 问题 交易 ，REDO 过 程 中 创建 的 SQL 语句 ， 和 旨 在 重新 应 用 一 致 时 间 点 之 后 的 有 
效 事务 。 由 于 REDO 过 程 中 不 会 对 异常 事务 生成 SQL， 所 以 执行 恢复 然后 运行 REDO SQL 可 以 将 数据 库 对 象 恢复 到 当前 状态 ， 不 
包括 异常 事务 。 


当 在 环境 中 REDO 事 务 时 ， 可 用 性 至 关 重 要 : 


1. 执 行 恢复 到 某 个 时 间 点 。 


2. 使 应 用 程序 和 数据 库 联机 。 


3.Redo 后 续 的 有 效 事务 完成 恢复 。 进 行 这 一 步 的 同时 ， 数 据 库 联机 用 于 并 行 读 / 写 操作 。 


如 果 你 使 用 存储 管理 软件 来 执行 备份 和 恢复 ， 那 么 数据 库 对 象 的 单个 映像 副本 备份 将 不 存在 。 在 这 种 情况 下 ， 你 需要 部 署 存 
储 管理 软件 来 进行 恢复 。 实 际 恢复 过 程 将 取决 于 所 使 用 的 存储 管理 软件 的 类 型 ， 以 及 (或 是 否 ) 该 软件 如 何 与 DBMS 恢 复 机 制 相 
互 作 用 。 


异地 灾难 恢复 是 最 全 面 的 数据 库 恢复 类 型 。 


异地 灾难 恢复 比较 少见 ， 但 却 是 最 全 面 的 数据 库 恢 复 类 型 。 自 然 灾害 (火灾 、 水 灾 等 ) 或 其 他 严重 事故 ， 使 我 们 无 法 使 用 主 
数据 处 理 中 心 时 需要 进行 异地 灾难 恢复 。 在 这 种 情况 下 ， 需 要 重建 整个 系统 环境 ， 以 及 恢复 DBMS、 数 据 库 对 象 和 数据 。 灾 难 恢 
复 在 第 17 章 中 有 更 详细 的 讨论 。 


选择 最 佳 恢复 策略 


那么 ， 什 么 是 最 好 的 恢复 策略 ”这 要 视 情 况 而 定 。 


从 历史 上 看 ， 恢 复 主要 针对 灾难 和 硬件 故障 ， 但 现在 没 那么 简单 了 。 事 实 上 ， 今 天 大 部 分 的 恢复 是 应 用 程序 的 问题 导致 的 。 
近期 行业 分 析 师 的 研究 表明 ， 大 多 数 系统 停机 是 因为 软件 的 问题 ， 而 不 是 硬件 的 问题 。 


现实 中 ，DBA 很 少 执行 真正 的 灾难 恢复 ， 除 了 在 测试 过 程 中 。 昌 然 介质 仍 会 出 故障 ， 但 故障 相对 较 少 。 用 户 错误 和 应 用 程 
序 故 障 是 数据 库 恢 复 的 最 常见 原因 ， 因 此 也 是 系统 不 可 用 的 主要 原因 。 


用 户 错误 和 应 用 程序 故障 是 数据 库 恢 复 的 最 常见 原因 。 


软件 问题 和 漏洞 ， 只 可 能 导致 某 些 事务 错误 或 需要 维护 。 遗 憾 的 是 ， 由 于 数据 库 变 得 越 来 越 大 ， 越 来 越 复杂 ， 所 以 会 出 现 异 
常事 务 破坏 业务 所 依赖 的 数据 。 看 起 来 事务 恢复 可 以 解决 可 用 性 问题 ， 但 对 于 某 些 问题 ， 事 务 恢复 既 不 可 行 ， 也 不 可 取 。 要 确定 
执行 恢复 的 类 型 ，DBA 必 须 考虑 几 个 问题 : 


“ 事务 识别 。 所 有 问题 事务 都 可 以 识别 吗 ? 你 必须 能 够 真正 确定 因 事务 恢复 而 从 将 数据 库 删除 的 事务 。 之 前 的 所 有 工作 是 否 
都 可 以 定位 和 重 做 吗 ? 


- 数据 完整 性 。 这 个 问题 发 生 后 ， 有 没有 人 更 新 了 某 些 行 ? 如 果 有 ， 你 还 可 以 继续 吗 ? 需要 的 所 有 数据 是 否 仍然 可 用 ? 干预 
重组 、 加 载 或 大 量 删 除 可 能 需要 使 用 映像 副本 备份 ， 来 消除 UNDO 恢 复 。 恢 复 会 不 会 导致 任何 其 他 的 数据 丢失 ， 丢 失 的 数据 是 否 
可 以 以 某 种 方式 重新 识别 并 应 用 ? 


. 速度 。 如 果 有 多 个 技术 可 行 ， 哪 一 个 执行 得 最 快 ? 执行 恢复 需要 哪些 数据 库 日 志 ? 还 可 以 怎么 做 来 减少 日 志 的 数量 〈 如 合 
并 增 量 副本 ) ? 


. 可 用 性 。 应 用 程序 多 久 以 后 可 以 再 次 使 用 ? 你 是 否 能 负担 得 起 应 用 程序 脱 机 的 费用 ? 
侵入。 故障 如 何 侵入 数据 库 ? 是 否 已 经 基于 异常 数据 作出 某 种 决定 ? 任何 后 续 工 作 的 结果 是 否 可 信 ? 
返工 的 成 本 是 多 少 ? 


所 有 这 些 问 题 实 际 上 都 可 以 归结 为 成 本 的 问题 。 返 工 的 成 本 是 多 少 ” 实 际 上 是 否 能 够 确定 哪些 需要 重 做 ”这 一 成 本 需要 与 通 
过 慢 扫 描 日 志 数据 集 来 隔离 需要 REDO 或 UNDO 的 数据 的 成 本 ， 以 及 通过 SQL 应 用 这 些 数据 的 成 本 进行 权衡 。 当 然 ， 你 会 面临 一 
个 额外 的 问题 : 哪 种 恢复 技术 适合 你 ， 它 们 是 否 依赖 DBMS? 


有 许多 因素 会 影响 恢复 过 程 的 持续 时 间 。DBA 可 以 采取 措施 ， 通 过 制定 智能 备份 和 恢复 计划 来 减少 停机 时 间 。 下 列 因素 可 


以 缩短 恢复 的 持续 时 间 : 
需要 恢复 的 组 件 越 小 ， 恢 复 过程 越 短 。 一 般 ， 需 要 做 的 越 少 ， 花 的 时 间 就 越 少 。 
* 考虑 分 区 数据 库 对 象 并 在 分 区 级 别 进行 备份 和 恢复 。 有 了 时， 影响 整个 数据 库 对 象 的 故障 可 以 限制 到 茶 个 分 区 。 


- 考虑 在 磁盘 中 保持 映像 副本 备份 和 日 志 归 档 文件 。 因 为 磁盘 文件 的 访问 速度 更 快 ， 访 问 过 程 不 需要 等 待 磁带 安装 ， 使 用 磁 
盘 而 不 是 磁带 ， 可 以 加 快 恢 复 过 程 。 


` 测试 映像 副本 备份 ， 确 保 它们 有 效 。 在 恢复 过 程 遇 到 无 效 的 映像 副本 会 延长 恢复 的 持续 时 间 。 当 发 现 无 效 映像 副本 备份 ， 
会 对 恢复 造成 不 利 的 影响 时 ， 可 以 采取 步 怠 来 创建 新 的 、 有 效 的 映像 副本 备份 。 


最 大 程度 自动 备份 和 恢复 程序 。 程 序 自动 化 可 以 从 中 消除 人 为 错误 ， 最 大 限度 地 减少 停机 时 间 。 


只 要 可 能 ， 数 据 库 设计 的 依赖 尽 可 能 少 。 自 治 数据 库 对 象 可 以 将 整个 恢复 的 持续 时 间 降 到 最 低 ， 因 为 同时 需要 恢复 的 相关 
数据 库 对 象 较 少 。 


` 最 后 ， 确 保 所 有 DBA 了 和 解 受 其 控制 的 每 个 数据 库 对 象 的 恢复 过 程 。 


故障 类 型 与 恢复 类 型 匹配 


故障 类 型 与 相应 的 恢复 类 型 匹配 。 


从 介质 故障 恢复 通常 涉及 恢复 到 当前 。 当 介质 出 现 故 障 时 ， 该 介质 上 的 数据 库 对 象 因此 变 得 不 能 访问 或 发 生 改变 。 在 这 种 情 
况 下 ,普遍 愿望 是 将 故障 介质 上 的 所 有 数据 库 对 象 恢复 到 故障 前 ， 换 句 话 说 ，DBA 将 尝试 恢复 这 些 数据 库 对 象 的 活动 和 数据 。 


从 事务 故障 中 恢复 ,通常 涉及 时 间 点 恢复 或 事务 恢复 。 根 据 定义 ， 事 务 恢复 是 由 错误 或 不 正确 地 执行 一 个 程序 造成 的 。 由 于 
程序 运行 不 当 而 导致 的 数据 库 变 更 必须 从 所 有 受 影 响 的 数据 库 对 象 中 删除 。 


从 数据 库 实例 或 子 系统 故障 中 恢复 ， 可 能 会 涉及 恢复 到 当前 。 恢 复 的 目标 是 ， 实 例 或 子 系统 所 有 数据 库 对 象 中 的 数据 都 回 到 
故障 之 前 ， 并 且 状 态 一 致 。 


1644 索引 恢复 


回想 一 下 前 面 有 关上 映 像 副本 备份 的 讨论 ， 索 引 恢 复 有 两 种 选择 : 
* 根据 表 中 的 数据 重建 索引 。 
* 根据 索引 本 身 的 备份 副本 恢复 索引 。 


大 多 数 DBM S 提 供 根据 表 中 的 数据 来 重建 索引 的 能 力 。 有 些 DBM S 支 持 这 两 种 恢复 方法 。 如 果 这 两 种 方法 都 可 以 使 
用 ，DBMS3 会 要 求 为 你 创建 的 每 个 索引 都 从 中 选择 一 种 方法 或 选择 其 他 方法 。 作 为 一 名 DBA， 需 要 检查 DBM 提供 的 所 有 索引 恢 
复方 法 ， 并 为 每 个 索引 选择 适当 的 方法 。 


一 般 情 况 下 ， 索 引 的 数据 量 越 大 ， 实 际 的 索引 越 大 ， 根 据 数 据 重建 该 索引 的 时 间 就 越 长 。 因 此 ， 当 数据 库 对 象 非常 大 时 ， 可 


以 考虑 使 用 映像 副本 备份 来 恢复 索引 。 当 然 ，“ 非 常 大 ”的 定义 很 模糊 ， 不 同 企业 有 不 同 的 定义 ， 取 决 于 数据 库 的 用 途 和 你 的 公 
司 可 以 容忍 的 停机 时 间 量 。 


当选 择 使 用 备份 和 恢复 索引 时 ， 一 定 要 同步 备份 和 恢复 索引 的 数据 库 对 象 。 换 句 话 说 ， 如 果 备份 一 个 表 空间 ,一定 也 要 复制 
任何 相关 的 索引 。 不 这 样 做 ， 可 能 会 导致 数据 完整 性 的 问题 。 


如 果 备 份 一 个 表 空间 ， 一 定 也 要 复制 任何 相关 的 索引 。 


16.4.5 ”测试 恢复 计划 

每 一 名 DBA 都 应 该 为 每 个 数据 库 对 象 准备 恢复 计划 ， 并 经 常 测试 。 恢 复 计划 描述 当 出 现 硬 件 故 障 或 本 地 灾难 (如 火灾 事 
件 ) 时 ， 你 将 使 用 的 恢复 程序 。 你 应 该 制定 恢复 计划 ， 并 经 常 测试 (最 好 每 年 不 低 于 两 次 ) 。 

制定 恢复 计划 ， 并 经 常 测试 。 

为 了 制定 恢复 计划 ， 需 要 : 

: 详细 写 下 恢复 计划 的 各 个 方面 ， 并 记录 每 个 步骤 。 

" 包括 备份 和 恢复 数据 库 对 象 所 需 的 所 有 脚本 。 

审查 计划 ， 找 出 实施 计划 的 人 。 

包括 参与 恢复 的 每 个 人 的 姓名 和 电话 号 码 的 联系 人 列表 。 

通过 修改 计划 使 其 涵盖 每 个 新 创建 的 数据 库 对 象 ， 来 保持 恢复 计划 最 新 。 


定期 测试 恢复 程序 包括 为 单个 数据 库 对 象 、 数 据 库 和 整个 数据 库 系统 ， 定 期 运行 恢复 测试 。 通 过 测试 恢复 程序 ，DBA 可 以 
确保 备份 和 恢复 脚本 正常 和 每 个 数据 库 对 象 确实 可 以 恢复 。 此 外 ， 定 期 恢复 测试 是 对 不 可 避免 、 充 满 压力 的 生产 数据 库 恢复 的 在 
只 培训 。 通 过 测试 恢复 计划 ，DBA 将 对 执行 恢复 所 需 的 工具 和 脚本 更 加 熟悉 。 


16.4.6 ”恢复 删除 的 数据 库 对 象 

到 现在 ， 一 直 在 讨论 备份 和 恢复 数据 。 但 是 ， 也 可 能 会 不 小 心 将 数据 库 对 象 删除 。 认 识 到 这 样 的 错误 ，DBA 将 需要 尽 可 能 
快 地 恢复 数据 库 对 象 ， 以 避免 可 用 性 和 完整 性 的 问题 。 

恢复 删除 的 对 象 ， 需 要 除了 正常 恢复 之 外 的 额外 步 又。 根据 DBMS 和 可 用 的 工具 ， 这 一 过 程 有 时 会 很 复杂 。 

恢复 删除 的 对 象 ， 需 要 除了 正常 恢复 之 外 的 额外 步骤 。 


通常 ， 通 过 内 部 标识 符 ， 每 个 DBMS 能 够 识别 受 其 控制 的 数据 库 对象 。 当 一 个 对 象 删除 并 重创 时 ， 该 对 象 的 内 部 标识 符 通常 
变 。 因 此 ， 使 用 相同 的 DDL 重 建 对 象 ， 以 及 使 用 之 前 的 映像 副本 备份 进行 恢复 通常 行 不 通 。 


要 恢复 删除 的 数据 库 对 象 ，DBA 可 能 需要 把 旧 的 数据 库 对 象 的 内 部 标识 符 转 化 为 新 的 数据 库 对 象 的 内 部 标识 符 。 有 关 示 
例 ， 请 参阅 “DB2 和 DSNICOPY”。 要 做 到 这 一 点 ， 你 必须 使 用 完全 相同 的 定义 来 重建 删除 的 数据 库 对 象 ， 该 定义 在 制作 映像 


副本 备份 时 才 会 生效 。 如 果 删 除 的 对 象 和 新 恢复 的 对 象 之 间 某 列 的 定义 不 同 ， 恢 复 可 能 会 失败 。 


当然 ， 如 果 有 逮 辑 备份 文件 ， 上 述 方案 并 不 适用 。 这 种 情况 ， 你 应 该 需要 重建 数据 库 对 象 ， 并 创建 加 载 脚本 来 重新 填充 数 
E. 


无 论 采用 何 种 方法 恢复 删除 的 数据 库 对 象 ， 请 记 住 删除 对 象 的 后 果 。 如 果 删 除 一 个 数据 库 对 象 ， 同 时 也 会 删除 其 所 有 的 从 属 
数据 库 对 象 ， 包 括 安全 授权 、 参 照 约 束 和 检查 约束 。 而 在 恢复 这 个 删除 的 对 象 的 同时 ， 你 需要 解决 所 有 这 些 问题 。 


DB2 和 DSN1COPY 
2Z/OS 的 DB2 提 供 了 一 个 叫做 DSN1COPY 的 工具 ， 可 以 用 于 恢复 DBMS 控 制 范围 之 外 的 数据 库 文件 。 当 DSN1COPY 运 行 


时 ，DB2 不 需要 运行 。 


此 外 ，DSN1COPY 实 用 程序 可 以 用 来 修改 DB2 使 用 的 内 部 对 象 标识 符 ， 以 识别 表 空 间 和 索引 空间 数据 集 。 使 用 OBIDXLAT 
选项 ，DBA 可 以 直接 DSN1COPY， 将 一 个 对 象 标识 符 转 化 成 另 一 个 标识 符 ， 这 样 数 据 就 可 以 恢复 到 类 似 的 〈 或 恢复 的 ) 数据 库 
对 象 ， 即 使 内 部 标识 符 与 映像 副本 备份 中 的 标识 符 不 匹配 。 


16.4.7 ”恢复 损坏 的 块 和 页 面 


损坏 的 块 或 页 面 是 一 段 包 含 不 良 或 不 一 致 数据 的 表 空 间或 素 引 。 损 坏 或 孤立 链 、 违 反 参 照 约束 、 损 坏 的 恢复 日 志 、 丢 失 或 额 
外 的 索引 条 目 或 其 他 一 些 隐 合 的 问题 ， 都 可 能 会 导致 数据 不 一 致 。 要 恢复 拥有 损坏 页 面 的 索引 ， 你 只 需要 根据 表 空间 中 的 数据 重 
建 索引 。 


从 数据 表 中 间 重 建 索引 。 


表 空间 则 不 相同 。 有 时 只 通过 停止 并 启用 表 空 间或 回收 DBMS 实 例 就 可 以 修复 一 个 损坏 的 页 面 。 此 外 ， 有 些 DBMS 自 带 修 复 
实用 工具 ， 可 根据 偏 移 位 在 文件 中 准确 定位 ， 并 在 位 或 字 节 级 替换 数据 。 在 使 用 任何 此 类 修理 工具 之 前 ， 务 必 彻底 阅 读 DBMS 说 
明 书 。 此 外 ， 确 保 这 一 纠正 措施 能 够 修复 损坏 的 页 面 。 修 复 实 用 程序 可 以 侵入 并 破坏 数据 库 的 内 容 。 有 时 DBM 供应 商 建议 这 样 
的 活动 要 在 DBMS 供 应 商 的 技术 支持 人 员 的 指导 下 进行 。 一 定 要 接受 这 些 建 议 ， 避 免 对 你 的 数据 造成 进一步 的 损害 。 


一 旦 恢复 了 信息 ， 你 可 能 还 需要 将 表 空 间 恢 复 到 当前 。 恢 复 将 应 用 那些 对 活动 造成 损害 的 日 志 记录 。 


16.4.8 ”填充 测试 数据 库 

填充 测试 环境 的 最 佳 途径 之 一 是 备份 生产 数据 库 。 这 样 的 数据 库 备 份 包含 生产 环境 中 给 定时 间 点 的 一 组 有 效 数 据 。 要 创建 测 
试 环 境 ，DBA 可 以 使 用 RECOVER 实 用 程序 或 者 可 以 读 取 备份 文件 的 逢 载 实 用 程序 。 

用 备份 生产 数据 库 填充 测试 环境 。 


根据 生产 数据 库 创 建 测试 系统 ， 可 以 对 生产 备份 的 结构 和 时 间 选 择 ， 以 及 测试 环境 的 结构 施加 特定 的 需求 。 如 果 在 没有 活动 
期 间 ， 没 有 备份 生产 数据 库 ， 恢 复 到 测试 环境 将 需要 生产 日 志文 件 。 


用 生产 数据 填充 测试 环境 ， 对 解决 某 些 类 型 的 生产 问题 是 可 行 的 。 例 如 ， 考 虑 一 个 24/7 月 底 报 告 及 月 底数 据 库 备份 的 应 
用 。 在 一 个 月 的 第 10 天 ， 业 务 用 户 在 月 底 报 告发 现 问题 。 要 解决 这 个 问题 ， 程 序 员 需 要 知道 第 一 个 月 数据 库 的 内 容 ， 因 为 在 过 


去 的 10 天 ， 数 据 库 发 生 了 很 多 变更 。 使 用 月 底 的 数据 ， 恢 复生 产 数据 库 不 是 一 种 选择 ， 但 业务 事务 必须 继续 。 这 种 情况 
下 ，DBA 可 以 使 用 月 底 生 产 数据 库 备份 来 填充 测试 环境 (用 月 底数 据 ) 。 程 序 员 现 在 可 以 使 用 包含 月 底 生 产 数据 的 测试 数据 库 
来 修复 月 底 报告 。 


16.5” 蔡 代 性 备份 和 恢复 


为 恢复 创建 映像 副本 备份 是 针对 故障 和 数据 丢失 的 最 常见 和 最 可 靠 的 保险 方法 。 然 而 ， 存 在 几 种 选择 : BASIN, BARR 
标准 的 备份 和 恢复 方法 。 接 下 来 简单 地 分 析 这 些 蔡 代 方法 。 


16.5.1 备用 数据 库 


Oracle 早 在 第 7 版 便 引 入 了 备用 数据 库 的 概念 。 备 用 数据 库 是 在 线 生产 数据 库 的 相同 副本 ， 在 数据 内 容 方面 几乎 是 最 新 的 。 
备用 数据 库 不 可 能 100% 最 新 ， 因 为 将 在 线 生产 数据 库 的 最 新 内 容 应 用 到 备用 数据 库存 在 系统 延迟 。 当 故障 发 生 时 ， 控 制 权 转 移 
到 备用 数据 库 ， 然 后 其 作为 在 线 生产 数据 库 保证 正常 活动 继续 。 


通常 ， 最 初创 建 备用 数据 库 要 通过 恢复 冷 备份 。 然 后 ， 来 自生 产 数 据 库 的 所 有 归档 日 志 必 须 复 制 并 应 用 到 备用 数据 库 。 从 每 
一 种 意义 上 说 ， 备 用 数据 库 都 应 该 在 恢复 模式 连续 运行 ， 因 为 当 对 生产 数据 库 执行 操作 时 ， 它 会 一 直 应 用 来 自生 产 数据 库 的 归档 


日 志 。 


但 是 ， 请 注意 ， 备 用 数据 库 不 表示 不 需要 进行 生产 数据 库 的 正常 备份 。 对 生产 数据 库 进 行 错 误 的 操作 将 复制 到 备用 数据 库 
上 上。 例如， 不 小 心 删除 的 行 在 备用 机 上 也 被 删除 。 


备用 数据 库 实施 起 来 相当 容易 ， 而 且 可 以 提供 从 某 些 类 型 的 故障 快速 恢复 。 然 而 ， 备 用 数据 库 几乎 都 不 是 完全 最 新 的 : 如 果 
生产 归档 丢失 ， 备 用 数据 库 就 变 得 不 同步 ， 只 有 复制 整个 数据 库 (不 只 是 某 些 数据 库 对 象 ) 。 


备用 数据 库 实施 起 来 相当 容易 。 


备用 数据 库 是 灾难 恢复 的 理想 选择 。 


16.5.2 复制 


数据 复制 涉及 在 单独 的 数据 库 副 本 存储 和 维护 匈 余 数据 。 复 制 的 数据 可 以 是 原始 数据 库 中 的 行 和 /或 列 的 一 个 子 集 。 实 现 一 
个 简单 形式 的 复制 ， 可 以 在 一 天 的 不 同时 间 将 整个 表 复制 到 多 个 位 置 。 当 然 ， 说 起 来 容易 做 起 来 难 。 有 些 DBMS 提 供 自动 复制 功 
能 ， 而 对 于 那些 没有 提供 这 一 功能 的 DBMS， 可 以 借助 第 三 方 工具 。 


有 些 DBMS 提 供 自动 复制 功能 。 


有 两 种 基本 技术 可 用 于 在 数据 库 之 间 复 制 数据 : 


对 称 复 制 。 


快照 复制 在 查询 源 数据 库 的 基础 上 生成 目标 系统 上 的 数据 库 表 的 副本 。 当 最 初 制作 快照 时 ， 运 行 指定 的 查询 (可 能 是 整个 
表 ) ， 并 且 将 得 到 的 数据 加 载 到 目标 快照 表 。 此 外 ， 每 个 副本 数据 库 应 包含 准确 最 新 的 信息 。 如 果 人 存在 多 个 副本 ，DBA 必 须 在 
同一 时 间 促 进 所 有 复制 副本 的 更 新 。 如 果 将 副本 更 新 在 不 同 的 时 间 表 中 ， 那 么 跟踪 每 个 副本 的 状态 就 变 得 非常 困难 。 


快照 复制 的 优点 是 易于 实施 。 然 而 ， 快 照 副本 可 能 会 快速 过 期 ， 刷 新 副本 可 能 会 导致 管理 和 性 能 问题 。 


对 称 复制 是 一 种 更 强大 的 复制 实现 方法 ， 因 为 它 可 以 使 副本 保持 最 新 。 可 以 通过 设置 对 称 复制 ， 确 保 所 有 副本 的 所 有 修改 在 
本 地 提交 之 前 没有 提交 任何 事务 。 另 外 ， 它 可 以 异步 复制 ， 使 每 个 数据 库 节 点 全 速 运行 而 不 因为 远程 数据 库 的 速度 问题 而 阻止 本 
地 更 新 。 主 数据 库 先 执行 COMMIT， 更 新 后 应 用 。 


相 比 快照 复制 ， 对 称 复制 的 最 大 优点 在 于 ， 其 可 以 将 主 数据 库 的 修改 自动 同步 到 副本 。 然 而 ， 设 置 和 管理 对 称 复 制 比 较 困 
难 ， 大 量 事务 可 能 会 导致 性 能 下 降 ， 而 且 由 于 修改 无 法 同步 ， 网 络 故障 也 会 导致 数据 库 失败 。 


复制 不 能 代 蔡 备份 和 恢复 。 但 在 某 些 情况 下 ， 它 可 以 提供 帮助 。 有 了 快照 复制 ， 便 可 能 将 快照 副本 作为 故障 之 前 的 某 个 时 间 
点 。 然 而 ， 对 称 复制 存在 与 备用 数据 库 同 样 的 问题 (问题 将 会 传播 到 副本 ) 。 这 两 类 复制 对 灾难 恢复 都 非常 有 用 。 


复制 不 能 代替 备份 和 恢复 。 


16.5.3 ”磁盘 镜像 


镜像 磁盘 设备 可 以 对 数据 库 添 加 一 个 额外 的 保护 级 别 。 分 配 的 辅助 设备 包含 主 设备 的 副本 时 即 发 生 磁 盘 镜 像 。 主 设备 进行 的 
所 有 数据 修改 ， 在 镜像 移动 设备 中 也 要 进行 。 如 果 主 设备 出 现 故障 ， 还 可 以 使 用 镜像 移动 设备 ， 这 样 不 会 造成 系统 中 断 。 当 然 ， 
对 于 相同 的 数据 量 ， 磁 盘 镜像 消耗 了 两 部 的 磁盘 存储 。 


与 复制 不 同 ， 磁 盘 镜像 的 数据 复制 发 生 在 设备 级 别 而 不 是 在 数据 库 级 别 。 


再 次 强调 ， 磁 盘 镜 像 并 不 能 取代 备份 和 恢复 ， 因 为 镜像 数据 与 遇 到 问题 的 数据 相同 。 但 磁盘 镜像 ， 可 以 消除 介质 故障 恢复 的 
必要 。DBA 可 以 不 恢复 故障 磁盘 上 的 数据 库 对 象 ， 而 是 切换 到 镜像 数据 。 


磁盘 镜像 可 以 消除 介质 故障 恢复 的 必要 。 


16.6 小结 


每 一 个 数据 库 对 象 都 有 深入 的 备份 和 恢复 计划 ， 是 数据 库 实施 计划 的 一 部 分 。DBA 的 职责 是 要 保护 数据 库 中 的 关键 数据 ， 
如 果 出 现 问题 ， 可 以 马上 恢复 。 此 外 ，DBA 必 须 能 够 最 大 限度 地 减少 因为 恢复 数据 库 的 完整 性 问题 和 故障 而 导致 的 停机 时 间 。 
数据 库 中 断 的 时 间 越 长 ， 对 企业 的 财务 影响 就 越 大 。 


16.7 [Elen 


1. 逻 辑 备 份 和 映像 副本 备份 之 间 的 区 别 是 什么 ? 

2. 停 顿 点 为 什么 对 时 间 点 恢复 非常 重要 ? 

3. 为 什么 备用 数据 库 、 复 制 、 磁 盘 镜像 不 能 取代 传统 的 备份 和 恢复 ? 
4. 哪 些 因 素 决 定数 据 库 对 象 应 制作 完整 或 增 量 映像 副本 备份 ? 

5. 请 说 出 三 类 需要 恢复 的 数据 库 故 障 的 名 称 并 予以 描述 。 

6. 请 详细 描述 恢复 索引 的 两 种 方法 。 

7. 术 语 日 志 归 档 是 什么 意思 ， 为 什么 说 它 对 可 恢复 性 很 重要 ? 

8. 请 说 出 影响 恢复 持续 时 间 的 四 个 因素 。 


9.DBA 应 该 根据 和 对 数据 库 对 象 评级 ， 来 确定 备份 的 频率 。 


10. 请 说 出 不 同类 型 的 恢复 的 名 称 ， 并 讨论 哪些 因素 会 对 何 时 执行 各 种 类 型 的 恢复 有 影响 。 
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第 17 章 ”防火 规划 


灾难 恢复 计划 就 像 是 保险 ， 你 很 高 兴 拥 有 它 ， 但 希望 永远 不 需要 它 。 买 了 汽车 保险 ， 你 定期 支付 费用 ， 一 旦 有 意外 ， 可 以 获 


得 理赔 。 换 句 话 说 ， 它 是 一 种 投资 。 灾 难 恢复 计划 与 之 类 似 ， 因 为 你 通过 指定 灾难 恢复 站 点 ， 传 输 数据 的 备份 副本 到 异地 ， 准 备 
恢复 工作 ， 执 行 恢复 程序 来 进行 投资 。 


灾难 恢复 计划 是 一 种 投资 。 


17.1 计划 的 必要 性 


灾难 恢复 计划 ， 也 叫 应 冬 计 划 ， 是 企业 的 资产 和 业务 面临 灾难 时 的 应 对 过 程 。 但 是 ， 什 么 是 灾难 ?SunGard 恢 复 服 务 
(1995) 对 灾难 提供 了 一 个 很 好 的 定义 : 计算 机 缺乏 处 理 能 力 超过 48 小 时 ， 造 成 的 任何 无 计划 的 、 扩 大 的 关键 业务 应 用 损失 。 
每 个 人 自己 的 定义 在 时 间 框 架 方面 可 能 会 或 多 或 少 不 太 严格 ， 但 基本 定义 是 这 样 的 。 


《DB2 开 发 人 员 指 南 》 (Mullins, 2012) 定义 灾难 为 : “发 生 概率 很 小 的 情况 下 ， 高 度 的 不 确定 性 ， 以 及 潜在 的 毁灭 性 的 
结果 。” 这 也 是 灾难 的 一 个 可 行 的 定义 。 


我 们 大 多 数 人 都 目睹 了 灾难 ， 至 少 在 电视 上 。 洪 水 、 地 震 、 飓 风 和 火灾 等 自然 灾害 。 灾 害 可 以 人 为 ， 如 电器 出 现 故障 、 水 管 
爆裂 和 战争 等 。 我 们 许多 人 曾 遇 到 过 地 下 室 被 淹 或 车 袜 。 灾 难 不 一 定 出 现 全 球 性 后 果 。 


你 必须 认识 到 潜在 的 灾难 ， 并 了 解 它们 的 后 果 。 灾 难 恢复 计划 的 唯一 目的 是 了 解 这 些 灾 害 会 如 何 影 响 你 的 业务 。 如 果 你 的 企 
业 位 于 海岸 ， 刚 风 和 洪水 的 可 能 性 就 会 增加 。 如 果 你 的 企业 坐落 在 中 西部 地 区 ， 出 现 龙卷风 的 机 会 就 会 更 大 。 如 果 位 于 北极 ， 暴 
风 雪 和 严寒 天 气 将 带 来 更 多 的 风险 。 加 州 的 企业 则 更 容易 担心 地 震 。 


尽管 灾难 是 不 可 预测 也 不 可 能 预测 的 ， 每 个 企业 都 应 该 有 一 个 应 对 灾难 情况 的 全 面 测试 计划 。 例 如 ， 考 虑 最 近 的 一 些 灾害 情 
况 。2005 年 ，“Katrina” 刚 风 影 响 了 美国 南部 海湾 地 区 。 这 是 美国 历史 上 损失 最 大 的 自然 灾害 ， 也 是 五 个 致命 的 飓风 之 一 。 
Katrina 限 风 损坏 或 摧毁 了 许多 企业 ， 包 括 石油 平台 、 炼 油 广 和 Mississippi 林 业 产 业 的 很 大 一 部 分 。 此 外 ， 数 十 万 当地 居民 失 
业 。 而 且 ， 当 然 , 我们 不 能 忘记 2001 年 9 月 11 日 恐怖 袭击 事件 ， 对 于 数据 中 心 在 世界 贸易 中 心 之 一 的 建筑 物 内 的 企业 造成 的 严重 
后 果 。 此 外 ， 许 多 灾害 位 置 不 特定 。 破 坏 、 计 算 机 病毒 、 恶 意 破 坏 、 空 调 或 加 热 故障 、 健 康 或 环境 危害 可 能 会 发 生 在 这 个 星球 上 
的 任何 地 方 。 


只 因为 你 的 企业 尚未 经 历 过 灾难 ， 或 者 不 在 高 风险 的 区 域 ， 并 不 表示 不 需要 进行 应 急 规划 ， 尤 其 是 对 你 的 数据 库 而 言 ， 更 有 
必要 。 在 经 历 灾 难 时 ， 有 灾难 计划 的 公司 能 够 再 次 服务 它们 客户 的 速度 远 远 超过 那些 没有 计划 的 公司 。 事 实 上 ,没有 灾难 恢复 计 
划 的 公司 面临 一 场 灾难 后 ， 可 能 永远 都 不 会 恢复 营业 。 


数据 库 灾 难 恢复 必须 是 整体 业务 恢复 计划 的 一 个 组 成 部 分 。 灾 难 恢复 计划 必须 是 全 球 范围 的 。 它 必须 能 够 处 理 业务 问题， 如 
业务 开展 的 备用 地 点 ， 告 知 员工 新 地 点 和 程序 的 通信 方式 ， 以 及 通知 客户 你 的 公司 灾后 如 何 办 理 业 务 等 。 它 必须 能 够 恢复 IT 基 础 
设施 。 最 后 ， 最 重要 的 是 ， 该 计划 的 一 个 组 成 部 分 必须 是 恢复 数据 库 和 数据 库 管 理 系统 业务 。 


然而 ， 公 司 应 该 采取 防 灾 规 划 的 程度 如 何 ” 公 司 确 定 可 恢复 性 的 相应 级 别 之 前 ， 必 须 先 分 析 风 险 并 确定 目标 。 


数据 库 灾 难 恢复 必须 是 整体 业务 恢复 计划 的 一 个 组 成 部 分 。 


17.1.1 ”风险 和 恢复 


灾难 恢复 计划 的 目标 是 尽量 减少 IT 设施 资源 或 能 力 损失 或 损害 造成 的 费用 。 任 何 数据 库 灾难 恢复 计划 的 成 功 很 大 程度 上 取决 
于 能 够 确定 丢失 数据 的 风险 。 如 果 数 据 丢 失 ， 对 你 的 业务 有 什么 影响 ? 


作为 本 地 数据 库 恢 复 ，DBA 必 须 评估 每 个 数据 库 对 象 的 灾难 恢复 。 回 想 一 下 ,第 16 章 (图 16-2) 用 于 评估 数据 库 对 象 临 界 
和 波动 的 网 格 。 虽 然 灾难 恢复 的 重点 临界 比 波动 更 多 ， 数 据 的 动态 仍然 起 着 一 定 的 作用 。 昌 然 为 了 灾难 恢复 ， 将 对 每 个 数据 库 对 
象 进行 分 级 ， 重 新 评估 在 灾难 中 完全 未 失 每 个 数据 库 对 象 的 后 果 ， 仍 然 是 一 个 很 好 的 做 法 。 


评估 每 个 数据 库 对 象 的 灾难 恢复 。 


当 分 析 丢 失 数 据 的 相关 风险 时 ， 牢 记 风 险 的 不 同类 型 。 数 据 方面 ， 有 三 类 风险 : 金融 损失 、 业 务 服务 中 断 和 法 律 责任 ,每 个 
类 别 内 风险 程度 又 有 不 同 。 每 个 应 用 程序 不 可 用 对 公司 有 不 同 的 影响 。 例 如 ， 考 虑 一 家 经 纪 公 司 。 股 票 交易 系统 不 可 用 比 雇员 薪 
资 应 用 程序 不 可 用 造成 的 损失 更 大 ， 目 前 的 业务 不 能 及 时 进行 ， 而 且 客 户 会 对 公司 未 来 的 业务 失去 信任 。 如 果 一 个 主要 的 证 券 交 
易 所 ， 如 纽约 证 券 交易 所 或 纳 斯 达 克 出 现 停电 ， 影 响 会 更 大 ， 会 影响 全 球 经 济 。 


业务 需要 必须 决定 优先 次 序 。 


当 创建 数据 库 的 灾难 恢复 计划 时 ， 请 记 住 ， 业 务 需要 必须 决定 优先 次 序 ， 而 不 是 技术 需求 和 问题 。 考 虑 根据 业务 需要 将 系统 
分 为 天 键 和 非 关 键 应 用 。 如 果 让 各 个 业务 单位 定义 关键 性 任务 ， 可 能 会 成 为 一 个 政治 点 梦 。 要 确定 哪个 系统 更 重要 ， 必 须 站 在 一 
个 更 高 的 层面 (关注 点 是 整体 业务 ) ， 不 能 交 给 单独 的 业务 单位 。 


将 应 用 程序 归 类 ， 当 应 用 程序 出 现 故 障 时 ， 确 定 哪些 应 用 程序 的 影响 最 大 。 
将 应 用 程序 归 类 ， 当 应 用 程序 出 现 故障 时 ， 确 定 哪些 应 用 程序 的 影响 最 大 ， 这 是 个 不 错 的 做 法 : 


. 非常 关键 应 用 程序 。 企 业 最 重要 的 应 用 将 恢复 时 需要 当前 数据 。 为 这 些 应 用 程序 制定 灾难 计划 是 最 困难 的 ， 因 为 异地 备份 
和 恢复 需要 更 多 的 步骤 。 另 外 ， 恢 复 时 必须 最 先 恢复 最 关键 的 应 用 程序 。 试 着 限制 这 一 类 应 用 程序 的 数量 ， 在 出 现 灾难 的 情况 
下 ， 超 过 半 打 左右 就 会 不 可 收拾。 


- 关键 业务 应 用 程序 。 关 键 业 务 应 用 程序 对 企业 非常 重要 ， 应 该 是 继 非常 关键 应 用 程序 后 的 下 一 组 恢复 对 象 。 关 键 业 务 应 用 
程序 经 常 需要 当前 的 数据 ， 但 它 在 远程 站 点 上 的 头 几 天 内 可 能 无 法 使 用 。 例 如 ， 考 虑 一 个 电话 服务 提供 商 的 应 用 程序 。 提 供电 话 
服务 的 系统 ， 是 一 个 非常 关键 的 应 用 程序 ， 客 户 账单 是 一 个 关键 业务 应 用 程序 。 


“ 关键 应 用 程序 。 关 键 应 用 程序 与 关键 业务 应 用 程序 的 区 别 在 于 它 的 及 时 性 或 数据 流通 需求 。 这 组 应 用 程序 ， 尽 管 重要 ， 但 
不 需要 立即 可 用 。 但 是 ， 如 果实 难 持续 了 一 个 星期 或 更 长 的 时 间 ， 企 业 可 能 会 需要 这 些 应 用 程序 。 关 键 应 用 程序 不 应 在 非常 关键 
和 关键 业务 应 用 恢复 前 恢复 。 这 些 应 用 程序 要 求 最 新 ， 或 过 期 一 天 或 过 期 一 周 。 


: 所 需 的 应 用 程序 。 所 需 的 应 用 程序 并 不 重要 ， 但 必须 备份 ， 这 样 如 果 需 要 ， 在 远程 站 点 可 以 恢复 它们 。 最 近 的 可 用 备份 通 
常 足 以 支持 这 样 的 应 用 程序 。 


* 非 关键 性 应 用 程序 。 在 灾难 发 生 时 不 需要 支持 非 关键 性 的 应 用 程序 。 很 少 有 应 用 程序 属于 这 一 类 ， 如 果 应 用 程序 不 是 很 关 
键 ， 何 必 将 它 摆 在 首位 呢 ? 


应 用 程序 的 关键 性 必须 基于 应 用 程序 对 企业 的 整体 重要 性 。 影 响 临 界 的 因素 包括 应 用 程序 不 可 用 的 财务 成 本 ， 企 业 对 每 个 应 
用 程序 及 其 数据 的 法 律 责任 ， 应 用 程序 重新 正常 运行 的 延迟 导致 失去 客户 和 未 来 业务 的 成 本 。 


作为 一 名 DBA， 必 须要 创建 灾难 恢复 计划 与 应 用 程序 临界 。 这 样 ， 当 公司 经 历 灾难 事件 时 ， 可 以 恢复 最 关键 的 数据 并 立即 
投入 使 用 。 基 于 这 些 应 用 程序 排名 ， 可 以 为 每 个 数据 库 对 象 部 署 适 当 的 备份 策略 ， 以 支持 数据 库 应 用 程序 。 


17.2 “一般 灾难 恢复 指南 


灾难 恢复 过 程 中 ， 你 的 目标 是 最 大 限度 地 减少 停机 时 间 和 数据 丢失 。 能 否 实现 这 些 目标 主要 取决 于 你 所 做 的 准备 工作 。 
最 大 限度 地 减少 停机 时 间 和 数据 丢失 。 


灾难 恢复 计划 是 一 项 企业 范围 的 任务 。 请 记 住 ，DBMS 和 数据库 的 恢复 仅 是 整体 灾难 恢复 计划 的 一 个 组 成 部 分 。 当 企业 在 创 
建 灾难 恢复 计划 时 ， 需 要 看 其 所 有 的 业务 功能 和 业务 活动 : 客户 接口 、 电 话 中 心 、 网 络 、 应 用 程序 和 可 能 会 受到 灾难 影响 的 每 一 
个 功能 。 然 而 ， 本 章 只 涉及 DBMS 和 数据 库 相 关 的 恢复 问题 。 对 于 全 面 的 灾难 恢复 ， 请 参阅 本 章 结尾 列 出 的 书籍 。 


17.2.1 远程 站 点 


当 灾 难 发 生 时 ， 你 需要 一 个 位 于 异地 的 位 置 ， 在 那里 你 可 以 建立 公司 的 业务 。 该 站 点 必须 离 主 站 点 足够 远 ， 自 然 灾 害 不 会 同 
时 破坏 这 两 个 站 点 。 有 时 成 功 和 失败 之 间 就 只 是 简单 的 常识 。 例 如 ， 远 程 位 置 不 应 该 与 主 站 点 在 同一 电网 、 同 一 河 漫 淮 ， 或 相同 
的 地 震 断 层 线 。 公 司 甚至 可 以 根据 不 同 的 企业 功能 多 选择 几 个 站 点 。 


如 果 公 司 很 大 ， 有 一 个 以 上 的 数据 中 心 ， 可 以 使 用 每 个 站 点 作为 其 他 站 点 的 备份 。 例 如 ， 如 果 Houston 数 据 中 心 摧 毁 ， 可 
以 将 业务 移 到 Pittsburgh 数 据 中 心 。 

其 他 公司 建立 了 一 个 特定 的 远程 位 置 ， 并 定期 将 数据 发 送 到 该 远程 位 置 。 当 灾难 发 生 时 ， 这 些 公 司 只 需 连接 到 备份 系统 。 这 
么 做 的 成 本 很 高 ， 但 对 一 些 企业 是 必需 的 。 

另 一 种 方法 是 与 灾难 恢复 服务 提供 商 签约 。 当 发 生 灾难 时 ， 服 务 提供 商 在 它们 的 计算 机 上 维护 可 以 用 来 恢复 业务 的 必要 设 
备 。 如 果 发 生 灾难 ， 你 负责 将 正确 的 应 用 程序 和 数据 安装 在 服务 提供 商 的 位 置 。 


备份 材料 的 存储 是 另 一 个 问题 。 在 理想 的 情况 下 ， 它 们 在 恢复 站 点 存储 保管 ， 但 如 果 不 可 以 ， 就 应 男 指定 一 个 异地 存储 位 
置 。 如 果 发 生 灾 难 ， 需 要 一 种 机 制 将 恢复 材料 从 存储 位 置 移 到 恢复 位 置 。 


备份 材料 必须 妥善 保管 。 


17.2.2 ”书面 计划 


书面 计划 是 任何 好 的 灾难 恢复 计划 的 基础 。 该 计划 应 分 发 给 所 有 灾难 恢复 方案 的 关键 人 员 。 每 个 参与 者 应 在 家 里 和 办 公 室 里 
保留 一 份 计划 。 恢 复 站 点 也 应 保留 一 份 计划 的 副本 。 


也 许 成 功 实施 灾 难 恢 复 计 划 的 最 大 挑战 是 保持 计划 最 新 及 其 相关 性 。 将 计划 作为 日 常 活动 的 一 部 分 。 确 保 DBA 的 自动 程序 
包括 灾难 恢复 计划 更 新 。 例 如 ， 当 创建 一 个 新 的 数据 库 对 象 时 ， 一 定 要 将 该 对 象 纳入 灾难 恢复 计划 中 。 同 样 ， 当 删除 一 个 数据 库 
对 象 时 ， 也 要 将 其 从 灾难 恢复 计划 中 删除 。 此 外 ， 当 向 系统 中 添加 新 的 应 用 程序 时 ， 一 定 要 评估 该 应 用 程序 的 关键 性 (临界 
性 ) ， 并 将 其 包含 在 灾难 恢复 计划 中 。 


简单 地 说 ， 灾 难 恢复 计划 是 一 份 动态 文件 ， 将 随 着 系统 、 要 求 和 使 用 的 变化 而 变化 。 一 旦 计划 有 变 ， 一 定 要 销毁 所 有 过 时 的 
计划 的 副本 ， 并 更 换 新 的 计划 。 


灾难 恢复 计划 是 一 份 动态 文件 。 
写 出 异地 灾难 恢复 遵循 的 具体 程序 和 政策 有 几 个 好 处 : 
` 使 你 在 灾难 发 生 时 采取 明确 的 行动 。 
* 使 你 将 这 些 行动 统一 为 具体 的 顺序 步骤 。 
+ 迫使 你 明确 具体 要 使 用 的 工具 和 所 需 的 确切 备份 信息 。 
* 记录 了 所 有 必要 信息 存储 的 位 置 ， 以 及 在 恢复 站 点 如 何 启用 这 些 信息 。 
:为 其 他 人 提供 了 一 个 蓝图 ， 以 防 熟 悉 该 计划 的 人 不 在 场 。 
创建 详细 的 灾难 恢复 计划 的 另 一 个 好 处 是 ， 它 会 突显 你 的 备份 程序 和 企业 需要 改进 的 地 方 。 


在 执行 灾难 恢复 计划 过 程 中 一 定 要 包括 所 有 利益 相关 方 。 这 些 不 仅 包 括 DBA 和 系统 程序 员 ， 也 包括 终端 用 户 、 系 统 操作 
员 、 业 务 经 理 ， 甚 至 你 的 客户 。 你 的 灾难 恢复 计划 应 包括 以 下 几 个 部 分 : 


: 异地 位 置 。 列 出 远程 位 置 ， 以 及 每 个 远程 站 点 的 电话 号 码 、 传 真 号 码 和 联系 地 址 。 可 能 还 包括 一 些 其 他 有 用 的 细节 ， 如 附 
近 的 酒店 列表 ， 恢 复 站 点 的 交通 选择 ， 费 用 将 如 何 处 理 ， 以 及 其 他 相关 信息 。 


" 人 员 。 列 出 恢复 团队 的 每 个 成 员 的 姓名 和 联系 信息 。 一 定 要 包括 每 个 团队 成 员 的 办 公 电 话 、 家 庭 电话 和 手机 号 码 。 
* 授权 。 列 出 恢复 操作 必要 的 安全 授权 和 已 授权 的 人 员 。 


所 有 系统 软件 、 应 用 程序 和 数据 的 恢复 程序 和 脚本 。 请 务必 为 每 个 系统 软件 、 每 个 应 用 程序 、 每 个 数据 库 对 象 提 供 完 整 的 
逐步 的 恢复 程序 ， 以 及 它们 存储 的 顺序 。 本 节 中 列 出 的 是 系统 软件 的 所 有 安装 磁带 清单 和 已 经 应 用 的 所 有 维护 磁带 清单 。 本 章 后 
面 的 内 容 将 涵盖 数据 库 恢复 程序 的 选项 。 


* 报告 。 列 出 你 在 恢复 站 点 需要 的 报告 ， 确 保 完全 恢复 。 报 告 应 列 出 每 个 备份 磁带 及 其 内 容 、 生 成 时 间 、 从 主 站 点 发 送 的 时 
间 和 到 达 远 程 站 点 的 时 间 。 作 为 一 个 附加 组 件 ， 还 要 包括 远程 站 点 备份 文件 的 命名 约定 的 描述 。 


灾难 恢复 计划 应 包括 异地 灾难 恢复 的 完整 说 明 。 但 是 ， 在 正式 提交 灾难 恢复 程序 之 前 ， 你 需要 作出 一 些 决定 。 要 作出 的 第 一 
个 决定 是 确定 灾难 恢复 目标 的 优先 级 。 你 是 希望 系统 尽快 恢复 ? 还 是 觉得 失去 尽 可 能 少 的 数据 更 重要 ? 或 者 ， 也 许 你 最 重要 的 目 
标 是 尽 可 能 避免 重新 处 理 数据 ? 根据 具体 的 恢复 目标 来 编写 灾难 恢复 计划 。 


灾难 恢复 计划 应 包括 异地 灾难 恢复 的 完整 说 明 。 


测试 灾难 计划 


一 旦 灾难 恢复 计划 编写 完成 ， 一 定 要 安排 定期 测试 。 一 个 很 好 的 做 法 是 在 远程 恢复 站 点 测试 灾难 恢复 计划 ， 每 年 至 少 一 次 。 
你 还 应 该 考虑 在 发 生 以 下 事件 后 对 计划 进行 测试 : 


在 远程 恢复 站 点 测试 灾难 恢复 计划 ， 每 年 至 少 一 次 。 


. 日常 业务 发 生 了 重大 变化 。 


系统 硬件 配置 变更 。 

: DBMS (或 相关 的 系统 软件 ) 升级 。 

. 负责 恢复 的 人 员 流失 (或 新 雇佣 ) 。 

| 主 数据 中 心 迁 移 到 一 个 新 位 置 。 

.日常 备份 程序 变更 。 

: 增加 了 主要 的 新 应 用 程序 或 现 有 关键 应 用 程序 的 重大 升级 。 
: 数据 或 每 日 事务 数量 的 增加 。 


使 用 灾难 恢复 测试 可 以 发 现 计划 中 的 弱点 和 错误 。 在 测试 完成 后 ， 一 定 要 更 新 灾难 恢复 计划 ， 解 决 有 关 问 题 。 成 功 的 恢复 不 
会 使 有 效 的 灾难 恢复 测 斌 结束， 虽然 这 是 预期 的 结果 。 披 圳 计划 弱点 的 灾难 恢复 测试 提供 了 一 个 有 用 的 目的 。 

安排 定期 灾难 恢复 测试 的 另 一 个 考虑 是 ， 保 证 人 员 做 好 准备 。 准 备 灾难 恢复 的 最 好 办 法 是 实施 灾难 恢复 。 实 际 执行 计划 的 过 
程 迫使 你 面 对 恢 复 过 程 需 要 解决 的 许多 烦琐 细节 。 测 试 可 以 帮助 确定 如 “漫长 的 停电 ”中 描述 的 问题 。 测 试 还 可 以 帮助 你 熟悉 在 
实际 灾难 恢复 中 将 用 到 的 工具 和 程序 。 

定期 灾难 恢复 测试 保证 人 员 做 好 准备 。 

其 实 ， 定 期 测试 灾难 恢复 计划 可 能 是 一 个 坏 想法 。 灾 难 恢复 测试 更 像 一 个 突击 测验 ， 不 给 你 准备 的 机 会 。 有 一 天 ， 你 的 老板 
来 上 班 ， 宣 布 某 个 地 方 的 办 公 楼 刚刚 摧毁 。 应 该 打 电 话 给 谁 ? 每 个 人 都 能 应 付 吗 ?如 何 找到 合适 的 人 到 远程 站 点 进行 恢复 ?你 手 
头 是 否 有 灾难 恢复 计划 ? 

恢复 实践 的 目标 是 利用 恢复 计划 发 现 问题 ， 为 关键 人 员 提 供 在 职 培训 ， 熟 悉 可 以 用 于 灾难 恢复 的 程序 和 工具 ， 以 提高 企业 应 
对 实际 灾难 的 战备 水 平 。 

当然 ， 你 可 能 觉得 不 事先 警告 就 进行 灾难 恢复 测试 很 不 切实 际 ， 如 果 涉 及 外 地 出 差 尤 其 如 此 。 然 而 ， 为 了 使 测试 更 接近 真实 
情况 ， 不 使 用 预先 警告 防止 作 浆 (也许 将 额外 的 材料 发 送 到 还 没准 备 好 的 异地 站 点 ) 。 

灾难 恢复 测试 应 该 包括 书面 计划 的 所 有 组 成 部 分 。 这 包括 搭建 作业 系统 、 安 装 DBMS、 恢 复 应 用 程序 和 数据 ， 并 对 成 功 恢复 
或 恢复 失败 环境 进行 测试 。 

正如 前 面 提 到 的 ， 应 该 定期 审查 异地 磁带 的 内 容 ， 确 保 它 们 始终 包含 正确 的 备份 数据 ， 不 只 是 在 测试 过 程 中 。 与 此 同时 ， 应 
该 检查 所 有 发 送 到 异地 的 附加 材料 ， 确 保 应 该 出 现在 那里 的 一 切实 际 上 都 存在 。 

漫长 的 停电 

2010 年 ，Nashville 经 历 了 150 年 以 来 的 洪水 纪录 ， 洪 水 淹没 了 最 繁华 的 地 段 ， 造 成 了 价值 约 为 1.5 亿 美元 的 损失 。 REAP 
事情 很 罕见 ， 叶 致 了 一 些 问题 。 

位 于 该 地 区 的 I 丁 部 门 在 过 去 进行 过 灾难 计划 和 测试 ， 但 灾难 计划 并 不 完整 。 所 以 ， 当 这 个 灾难 实际 发 生 时 ， 他 们 花 了 几 个 小 
时 为 灾难 做 准备 。 

没有 数据 丢失 ， 系 统 也 恢复 了 正常 。 但 是 ， 随 着 时 间 的 推移 ， 他 们 意识 到 他 们 必须 为 发 电机 加 油 。 他 们 从 来 没有 做 过 。 许 多 
建筑 物 都 没有 电 ，IT 工 作者 不 得 不 每 过 四 个 小 时 为 四 个 楼 层 加 五 加 仓 的 柴油 锥 …… 一 直 持 续 了 几 个 星期 。 


也 许 IT 人 员 中 经 常 健身 的 人 应 该 参与 到 此 次 灾难 恢复 计划 和 测试 …… 


[1] 不 包括 道路 和 桥梁 或 公共 建筑 的 损失 ， 以 及 建筑 物 和 住宅 内 部 的 一 切 损失 。 


17.2.3 人员 


选择 合适 的 团队 设计 和 实施 灾难 恢复 计划 ， 对 计划 的 成 功 至 关 重 要 。 从 DBMS 的 角度 来 看 ， 灾 难 恢 复 团队 必须 能 够 安装 和 配 
置 DBMS 系 统 软件 ， 确 保 DBMS 与 其 他 系统 软件 组 件 整 合 ， 恢 复 单个 数据 库 、 测 试 数据 库 的 完整 性 、 恢 复 没有 存储 在 数据 库 中 的 
相关 数据 、 安 装 和 配置 应 用 软件 、 测 试 应 用 程序 ， 并 关注 其 中 的 许多 细节 。 换 名 话说， 团队 必须 具有 多 种 技能 并 具有 很 强 的 适应 
能 力 。 此 外 ， 团 队 成 员 必须 兼 具 IT 技能 和 业务 技能 。 


选择 合适 的 团队 是 关键 。 


团队 组 建 完 成 后 ， 必 须 对 每 个 成 员 进 行 培训 ， 使 其 了 解 灾 难 恢复 的 后 果 。 这 也 意味 着 ，DBA、 程 序 员 和 团队 的 SA 需要 了 解 
企业 灾难 恢复 的 业务 方面 ， 业 务 用 户 需 要 了 解 灾 难 恢复 的 IT 方 面 ， 至 少 在 一 个 非常 高 的 水 平 。 


整个 团队 应 定期 召开 会 议 ， 进 行 交 叉 培 训 ， 至 少 每 年 都 要 进行 灾难 恢复 测试 。 请 记 住 ， 必 须 给 予 团 队 成 员 适 当 的 授权 ， 使 其 
能 够 在 远程 站 点 执行 其 灾难 恢复 。 没 有 什么 比 缺乏 执行 权限 更 能 阻止 灾难 恢复 的 速度 了 ， 特 别 是 如 果 周 围 没有 人 能 为 他 们 授权 ， 
这 在 灾难 恢复 中 非常 关键。 


17.3 ”为 灾难 恢复 备份 数据 库 


灾难 恢复 过 程 很 大 程度 上 取决 于 你 备份 数据 的 方法 。 如 果 你 依赖 磁盘 卷 备份 ， 恢 复 将 是 一 次 一 卷 。 如 果 你 创建 映像 副本 ， 可 
能 会 使 用 DBMS 的 RECOVER 实 用 程序 或 第 三 方 恢复 工具 。 当 然 ， 你 可 能 会 结合 几 种 不 同 的 技术 进行 异地 备份 ， 取 决 于 数据 的 敏 
感性 和 临界 性 。 下 面 来 看 几 个 不 同 的 灾难 恢复 的 备份 策略 。 


17.3.1 磁带 备份 
有 效 的 灾难 恢复 备份 策略 使 用 的 技术 与 创建 本 地 备份 文件 的 技术 相同 。 根 据 映像 副本 备份 创建 多 个 输出 文件 ， 并 发 送 至 少 一 


它们 在 灾难 中 被 毁 的 可 能 就 越 小 。 
你 可 以 使 用 与 创建 本 地 备份 文件 相同 的 技术 。 
出 于 灾难 恢复 的 目的 ， 通 常 不 需要 备份 索引 。 在 灾难 恢复 站 点 将 数据 恢复 以 后 ， 可 以 重建 索引 。 


所 有 发 送 到 远程 站 点 的 备份 文件 ， 每 天 都 生成 一 份 报告 。 在 本 地 站 点 保留 一 份 报告 副本 ， 同 时 发 送 一 份 到 远程 站 点 。 报 告 应 
详细 说 明 进 行 恢复 所 需 的 信息 ， 包 括 文 件 名 、 备 份 类 型 (完整 或 增 量 ) 、 如 何 创建 映像 副本 (数据 库 实用 程序 或 文件 系统 命 
令 ) 、 备 份 的 日 期 和 具体 时 间 、 发 往 异 地 的 日 期 和 和 时间、 接收 的 日 期 和 和 时间、 异地 接收 的 日 期 和 和 时间 (如 果 可 能 ) 。 


此 外 ， 


你 需要 备份 数据 库 日 志 ， 并 把 它们 发 送 到 远程 站 点 。 不 能 将 日 志文 件 副本 发 送 到 远程 站 点 就 意味 着 ， 只 能 将 每 个 数据 
库 对 象 恢复 到 上 一 次 备份 的 时 间 点 。 请 参考 图 17-1。 在 这 种 情况 下 ， 已 经 备份 了 数据 库 对 象 并 将 副本 发 送 到 远程 站 点 。 副 本 经 

过 包装 邮寄 到 远程 站 点 ， 或 可 能 通过 宽带 连接 到 远程 位 置 。 接 下 来 修改 数据 库 对 象 ， 然 后 灾难 友 生 。 从 映像 副本 备份 到 灾难 发 生 
这 一 段 时 间 没有 备份 数据 库 日 志 ， 所 有 的 变更 都 会 丢失 


异地 恢复 期 间 丢 失 的 数据 量 依赖 数据 库 日 志文 件 备份 的 及 时 性 
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图 17-1 ”数据库 日 志和 灾难 
备份 数据 库 日 志 ， 并 把 它们 发 送 到 远程 站 点 


在 远程 站 点 ， 数 据 库 对 象 的 恢复 一 个 接 一 个 地 执行 。 数 据 恢复 以 后 重建 索引 。 恢 复 后 ，DBA 应 该 使 用 可 以 使 用 的 任何 工具 
和 实用 程序 来 识别 并 解决 任何 数据 完整 性 问题 和 约束 违规 

可 能 还 需要 额外 的 准备 ， 取 决 于 DBMS 和 使 用 的 操作 系统 。 例 如 ， 如 果 DBMS 记 录 了 映像 副本 备份 ， 
所 有 异地 备份 都 在 系统 目录 中 列 出 的 那个 时 间 点 


， 否 则 ， 一 些 异 地 映像 副本 备份 ， 可 


当然 ,不 论 DBBMS 如 何 ， 为 了 恢复 所 有 的 数据 库 对 象 
DBMS 安 装 好 之 后 再 恢复 。 


需要 将 系统 目录 恢复 到 
可 能 无 法 应 用 。 


需要 在 远程 站 点 恢复 系统 目录 。 其 他 DBMS 相 关 的 文件 也 需要 在 


在 远程 站 点 为 每 个 数据 库 对 象 至 少 保留 三 个 备份 


带 。 这 样 如 果 一 个 或 多 个 映像 副本 磁带 损坏 ， 还 可 以 提供 一 个 缓冲 。 一 旦 
磁带 出 现 故 障 ， 额 外 的 磁带 可 以 使 用 以 前 的 备份 。 此 外 ， 如 果 有 数据 库 日 志 
长 。 


志 ， 就 能 完 


全 恢复 数据 库 对 象 ， 即 使 恢复 需要 的 时 间 更 


最 后 ， 当 使 用 这 种 方法 时 ， 一 定 要 查询 [DBMS 供 应 商 提 供 的 文档 ， 了 解 DBBMS 远 程 站 点 恢复 的 详情 
查询 DBMS 供 应 商 提 供 的 文档 ， 了 解 DBMS 远 程 站 点 恢复 的 详情 


17. 


执行 ， 


3.2 存储 管理 备份 

灾难 恢复 备份 的 男 一 种 方法 是 使 用 存储 管理 软件 ， 对 整个 磁盘 组 进行 时 间 点 复制 。 这 种 方法 极 大 地 简化 了 灾难 恢复 的 准备 和 
但 这 种 策略 正常 实现 需要 一 个 重大 的 系统 中 断 。 要 使 用 存储 管理 软件 进行 备份 ， 请 按照 下 列 操作 步 又 : 

使 用 存储 管理 软件 ， 对 整个 磁盘 组 进行 时 间 点 复制 。 

1. 停 目 DBMS， 创 建 用 于 恢复 的 系统 范围 点 上 的 稳定 性 。 

2. 复 制 所 有 的 数据 库 对 象 ， 使 用 存储 管理 软件 转 储 完整 的 磁盘 卷 到 磁带 上 。 


3. 当 所 有 包含 数据 库 对 象 的 磁盘 卷 已 成 功 复制 时 ， 重 启 DBMS。 


然后 在 远程 站 点 使 用 存储 管理 软件 ， 恢 复 一 个 完整 的 磁盘 卷 。 这 种 方法 的 最 大 问题 是 要 求 停止 DBMS。 由 于 电子 商务 或 全 球 


24/7 的 要 求 ， 大 多 数 企 业 都 无 法 容忍 这 样 的 中 断 。 


作为 停止 整个 DBMS 的 一 种 替代 方法 ， 可 以 逐个 复制 应 用 程序 的 数据 。 使 用 这 种 方法 需要 定期 调度 工作 : 
1. 停 止 应 用 程序 。 

2. 停 止 或 静止 相关 的 数据 库 对 象 。 

3. 用 存储 管理 软件 备份 数据 库 对 象 。 

4. 备 份 完成 后 ， 重 启 应 用 程序 和 数据 库 对 象 。 


当然 ， 这 样 的 妥协 使 灾难 计划 和 远程 站 点 恢复 变 得 更 加 复杂 。 包 含 应 用 程序 数据 的 文件 不 可 能 存储 在 单个 磁盘 驱动 器 上 。 


此 ， 找 到 需要 备份 的 磁盘 和 文件 更 加 困难 。 

一 般 情 况 下 ， 停 止 DBMS 和 使 用 存储 管理 软件 进行 灾难 恢复 备份 ， 对 于 那些 愿意 为 了 准备 灾难 恢复 而 牺牲 全 天 候 可 用 性 的 企 
业 是 有 效 的 。 
17.3.3 ”其 他 方法 

虽然 前 两 种 方法 是 最 常 实 施 的 灾难 恢复 策略 ， 但 也 还 存在 许多 其 他 的 方式 和 选项 。 部 署 一 个 广域网 (WAN) ,协助 发 送 备 
份 到 远程 站 点 是 一 个 很 好 的 战术 。 如 果 使 用 广域网 连接 可 以 将 你 的 主 站 点 连接 到 远程 站 点 ， 你 可 以 将 异地 备份 转移 到 远程 位 置 的 
一 个 电子 磁带 库 。 当 然 ， 任 何 主 站 点 和 远程 站 点 之 间 的 直接 连接 都 会 增加 一 个 位 置 为 另 一 个 位 置 带 来 灾难 的 机 会 (虽然 如 果实 施 
得 当 ， 网 络 连 接 的 风险 非常 小 ) 。 


灾难 恢复 准备 的 另 一 种 方法 是 通过 网 络 将 数据 远程 镜像 到 备用 站 点 。 这 种 方法 可 以 减少 恢复 远程 站 点 所 需 的 准备 ， 因 为 有 数 


据 镜 像 。 为 了 使 这 个 策略 有 效 ， 所 有 主 站 点 变更 都 必须 镜像 到 远程 站 点 ， 包 括 定 期 的 数据 库 变更 (INSERT, UPDATE, 
DELETE) 、 数 据 库 实用 操作 (LOAD 和 REORG) 和 本 地 数据 库 恢复 操作 。 


Oracle 数 据 库 的 备用 数据 库 选 项 可 以 作为 一 种 灾难 恢复 方法 。 只 要 备用 数据 库 与 主 数据 库 的 物理 站 点 不 同 ， 备 用 数据 库 可 


作为 Oracle 实 现 灾 难 恢复 计划 的 一 个 不 错 的 选择 。 


17.3.4 “一些 指导 


为 了 使 恢复 计划 有 效 ， 你 需要 遵循 书面 计划 。 遵 循 计划 中 记录 的 所 有 日 常 预防 措施 ， 确 保 灾难 事件 发 生 时 ， 关 键 数 据 的 可 恢 
复 性 。 映 像 副本 备份 或 磁盘 备份 需要 在 指导 下 进行 并 尽快 发 送 到 远程 站 点 。 报 告 打 印 出 来 ， 发 送 到 异地 站 点 。 缺 少 任何 一 个 小 细 
节 ， 可 能 使 灾难 恢复 计划 变 得 无 效 。 


当 测 试 灾难 恢复 计划 时 ， 确 保 每 个 团队 成 员 严 格 遵 循 书面 指示 。 当 然 ， 如 果 测 试 过 程 中 漏 掉 一 些 内 容 或 计划 中 无 记载 ， 也 可 
能 会 出 问题 。 一 定 要 捕捉 所 有 这 些 事件 并 更 新 书面 计划 。 请 记 住 ， 如 果真 的 发 生 灾难 ， 你 可 能 需要 依靠 经 验 不 足 的 人 ,或 者 顾问 
和 非 正式 员工 。 书 面 计划 越 详尽 ， 灾 难 恢复 成 功 的 概率 就 越 大 。 


以 下 有 一 些 简单 的 技巧 和 提示 ， 制 定数 据 库 灾 难 恢复 计划 时 需 牢记 。 
恢复 的 顺序 


在 灾难 站 点 恢复 任何 数据 库 对 象 之 前 ， 都 要 确保 操作 系统 和 DBMS 的 版 本 和 维护 级 别 正确 。 一 定 要 严格 遵循 书面 计划 中 记录 
的 恢复 步骤 。 


数据 延迟 


数据 多 长 时 间 了 ”如果 你 每 天 晚上 都 将 备份 磁带 放 到 另 一 个 位 置 ， 数 据 可 能 过 期 24 小 时 。 有 时 ， 过 期 如 此 长 时 间 的 数据 是 
不 可 接受 的 ， 一 天 发 送 一 次 备份 介质 到 异地 存储 的 成 本 太 高 。 一 种 解决 办 法 是 将 数据 放 到 另 一 个 位 置 ， 如 通过 日 志 传 送 或 复制 。 


当 灾 难 发 生 时 ， 数 据 库 日 志 可 能 无 法 在 异地 恢复 位 置 使 用 。 有 些 数据 可 能 无 法 完全 恢复 ， 这 个 问题 真 的 没有 办 法 解决 。 数 据 
库 对 象 和 数据 库 日 志 的 备份 副本 发 送 到 异地 的 速度 越 快 ， 数 据 流通 方面 的 灾难 恢复 就 越 好 。 


记 住 其 他 重要 数据 


创建 数据 库 对 象 的 异地 备份 可 能 无 法 保证 每 个 应 用 程序 完整 的 灾难 恢复 计划 。 请 务必 备份 相关 数据 并 将 其 友 送 到 异地 。 需 要 
备份 的 额外 数据 和 文件 包括 : 


< 恢复 和 测试 脚本 库 的 DDL 数 据 库 对 象 。 

- 应 用 程序 的 源 代码 和 可 执行 文件 。 

+ 存储 过 程 的 程序 源码 和 可 执行 文件 。 

“ 用 户 自 定义 的 函数 的 源 文件 和 可 执行 文件 。 
. 关键 的 第 三 方 DBA 工 具 库 和 密码 。 


- 应 用 程序 所 使 用 的 相关 数据 文件 。 


谨防 压缩 与 加 密 


如 果 网 站 使 用 磁带 压缩 软件 ， 那 么 确保 远程 恢复 站 点 也 使 用 相同 的 磁带 压缩 软件 。 否 则 ， 了 映像 副本 备份 在 远程 站 点 将 不 可 
读 。 如 果 远 程 站 点 的 磁带 无 法 读 取 压 缩 文 件 ， 关 闭 主 站 点 的 灾难 恢复 备份 压缩 。 


确保 远程 恢复 站 点 使 用 相同 的 磁带 压缩 软件 。 
同样 地 ， 如 果 备份 副本 经 过 加 密 ， 确 定 远程 站 点 可 提供 解密 密 钥 ， 否 则 备份 副本 不 可 读 。 
恢复 后 的 映像 副本 


灾难 恢复 过 程 中 的 一 个 重要 组 成 部 分 ， 是 数据 库 对 象 在 远程 站 点 恢复 以 后 ， 为 每 个 数据 库 对 象 创建 一 个 映像 副本 备份 。 这 样 
做 可 以 在 远程 站 点 发 生 错 误 的 情况 下 ， 更 容易 恢复 数据 。 如 果 没 有 新 的 映像 副本 备份 ， 一 旦 发 生 错误 ， 远 程 站 点 开始 处 理 后 ， 需 
再 次 进行 灾难 恢复 过 程 。 


174 ”灾难 防治 


一 般 情 况 下 ，DBA 和 IT 专业 人 士 创 建 程序 并 执行 政策 。 许 多 这 些 程序 和 政策 ， 如 灾难 恢复 计划 ， 就 是 处 理 这 种 灾难 的 情况 。 
有 这 样 的 程序 和 政策 是 非常 明智 的 。 然 而 ， 建 立 程序 和 政策 ， 将 防止 放 在 首位 难道 不 明智 ? 虽然 你 不 能 阻止 地 震 或 洪水 ， 但 你 上 
以 实施 政策 ， 防 止 出 现 人 祸 。 例 如 ， 使 用 电 涌 保护 器 ， 让 备用 发 电机 在 电力 中 断 的 情况 下 待机 ， 可 以 防止 电源 浪 涌 破坏 计算 设 
a. 


另 一 个 不 错 的 主意 是 记录 并 将 程序 传播 给 终端 用 户 ， 教 他 们 如 何 处 理 错误 信息 。 你 不 能 期 望 每 个 用 户 都 了 解 响应 每 一 个 错误 
消息 的 影响 。 根 据 不 同 的 应 用 程序 ， 错 误 的 用 户 响 应 错误 可 能 会 导致 数据 丢失 。 指 南 可 以 帮助 避免 错误 和 人 为 灾害 。 


17.4.1 ”灾难 和 应 急 计划 网 站 


网 络 上 有 许多 有 用 的 网 站 ， 详 细 讲 述 灾 害 和 应 急 计划 的 细节 。 下 列 网 站 提供 了 更 多 的 灾难 恢复 计划 ， 不 同 于 本 章 讨论 的 以 数 
据 库 为 中 心 的 方法 。 

”WwWw.thebci.org; 

- Www.8lobalcontinuity.com ; 


”WwWwW.Sungatd.com ; 


- www.disastcrrecovcry.com/ o 


175 aa 


DBA 工 作 的 关键 部 分 是 制订 计划 ， 减 少 灾难 发 生 时 的 损失 。 其 主要 目标 是 恢复 应 用 程序 ， 并 且 尽 量 减少 数据 丢失 和 中 断 。 


许多 组 件 都 需要 建立 可 行 的 灾难 恢复 计划 ， 但 当务之急 是 建立 和 维护 全 面 的 书面 计划 。 虽 然 DBA 的 职责 范围 主要 是 确保 数据 库 
的 可 用 性 和 数据 的 完整 性 ，DBA 必 须 是 灾难 恢复 团队 的 一 部 分 。 创 建 一 个 可 用 的 灾难 恢复 计划 ， 定 期 规划 ， 测 试 和 修改 都 是 至 
天 重要 的 。 


17.6 回顾 


1. 什 么 是 灾难 ? 

2. 请 描述 两 个 不 同 的 数据 库 灾 难 备份 和 恢复 方法 。 

3. 在 灾难 恢复 计划 中 ， 当 确定 数据 库 对 象 的 关键 性 时 ， 应 考虑 哪些 因素 ? 

4. 数 据 库 日 志 在 灾难 恢复 中 起 什么 样 的 作用 ? 

5. 选 择 一 个 可 行 的 灾难 恢复 站 点 有 哪些 注意 事项 ? 

6. 为 保证 恢复 可 行 ， 灾 难 恢复 团队 成 员 必须 具备 哪些 能 力 ? 

7 一 旦 灾难 恢复 计划 编写 完成 ， 就 不 应 该 再 修改 ， 这 种 说 法 正确 与 否 ? 

8. 为 什么 说 对 用 于 灾难 恢复 计划 的 应 用 程序 和 数据 库 对 象 进行 排名 ， 是 一 个 好 主意 ? 
9. 有 关 数 据 的 三 类 风险 是 什么 ? 


10. 定 期 进行 有 计划 的 灾难 恢复 测试 是 一 个 好 的 做 法 。 但 是 ， 什 么 事件 让 你 越发 频繁 地 测试 灾难 恢复 计划 ? 
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第 18 草 ”数据 和 存储 管理 


所 有 DBMS 都 依赖 数据 文件 存储 数据 ， 这 些 文件 或 数据 集 ， 都 驻 留 在 存储 介质 或 设备 中 。 因 此 ， 存 储 管理 是 DBA 对 数据 库 操 
作 的 一 个 关键 部 分 。 通 常情 况 下 ， 存 储 意味 着 固定 磁盘 驱动 器 或 磁盘 子 系 统 ， 但 存储 也 意味 着 非 易 失 性 存储 、 固 态 器 件 、 可 移动 
存储 设备 、 光 存储 设备 或 磁带 设备 。 

由 于 DBA 与 存储 数据 的 数据 库 管理 系统 打交道 ，DBA 的 部 分 工作 将 涉及 规划 数据 库 数据 的 实际 存储 。 为 了 执行 这 项 工 
作 ，DBA 必 须 熟悉 实际 用 于 数据 存储 的 物理 机 制 。 此 外 ，DBA 必 须 了 解 ， 与 数据 (永久 存储 介质 上 ) 的 物理 存储 交互 的 数据 库 
如 何 体现 数据 的 抽象 概念 。 


18.1 存储 管理 基础 


作为 一 个 法 则 ，DBMS 供 应 商 不 能 证 明 或 明确 支持 任何 第 三 方 的 存储 产品 。 前 提 是 ， 其 本 身 有 可 靠 的 基础 存储 技术 。 要 确定 
每 个 DBMS 最 适合 的 存储 技术 ，DBA 必 须 首 先 对 一 些 产品 、 技 术 和 提供 人 存储 解决 方案 的 供应 商 进行 评估 ， 昌 然 大 多 数 仓储 技术 适 
用 于 大 多 数 DBMS 产 品 ， 一 些 存 储 技术 在 性 能 、 可 靠 性 、 可 用 性 和 成 本 方面 更 适合 。 


一 些 存 储 技术 更 适合 。 


用 于 数据 管理 的 存储 技术 主要 是 磁盘 驱动 器 。 由 于 平均 故障 间隔 时 间 (MTBF) 不 断 增加 ， 现 代 磁 盘 驱动 器 比 过 去 几 年 变 得 
更 可 靠 。 实现 磁 盘 驱 动 器 超过 100000 小 时 的 可 用 性 并 不 罕见 。 但 是 ， 磁 盘 驱 动 器 的 机 械 性 质 ， 使 它们 比 其 他 计算 机 元 件 更 容易 


出 现 故 障 。 由 于 系统 中 的 磁盘 驱动 器 数量 增加 ， 系 统 的 脆弱 性 也 在 增加 。 单 个 企业 依靠 数 百 或 数 干 个 磁盘 驱动 器 支持 其 数据 库 应 
用 程序 的 情况 并 不 少见 。 此 外 ， 数 据 库 使 用 磁盘 驱动 器 的 方式 可 能 使 存储 管理 变 得 不 可 预知 ， 见 “现代 DBMS 磁 盘 使 用 情况 ”。 
某 些 现代 的 存储 解决 方案 (如 RAID) 可 用 来 解决 一 些 MTBF 问 题 。 


然而 ， 对 于 关键 任务 应 用 程序 ， 数 据 的 完 束 性 比 数据 的 可 用 性 更 重要 。 如 果 人 存储 介质 不 可 靠 ， 出 现 故 障 导致 数据 损坏 ， 数 据 
丢失 比 停机 更 加 严重 。 因 此 ， 使 用 数据 库存 储 解决 方案 不 惜 一 切 代价 保护 数据 非常 有 必要 。 


数据 库 性 能 依赖 /O，DBMS 完 成 一 次 Il/O 操 作 的 速度 越 快 ， 数 据 库 应 用 程序 的 运行 速度 就 越 快 。 请 记 住 ， 存 储 介质 的 数据 
金 索 比 缓存 或 内 存 中 的 数据 检索 需要 的 时 间 更 长 。 出 于 这 个 原因 ， 一 些 现代 的 存储 系统 提供 高 速 缓存 机 制 ， 将 数据 预 安排 在 内 人 存 
中 ， 从 而 减少 与 传统 磁盘 |/O 操 作 相关 的 等 待 时 间 。 


数据 库 性 能 依赖 I/O 。 


事实 上 ， 人 存储 正在 成 为 业务 运作 的 核心 。 异 构 、 多 TB 的 数据 库 站 点 如 今 并 不 少见 。 要 存储 的 数据 量 比 以 往 任何 时 候 都 更 
大 ， 存 储 的 时 间 也 更 长 。IBM 公 司 的 前 任 CEO Lou Gerstner [1 总 结 出 了 惊人 的 数据 增长 速度 : “在 IBM 内 部 ， 我 们 谈论 上 网 的 
人 增加 了 10 倍 ， 网 速 增加 了 100 倍 ， 设 备 增 加 了 1000 倍 以 上 ， 数 据 增 加 了 1000000 倍 以 上 。” Gerstner 先 生 不 是 唯一 注意 到 如 
此 惊人 的 增长 速度 的 人 : 


过 了 泽 字 节 (1 万 亿 GB) 四。IDC 预 测 2011 年 创造 的 数 


iS 


* 据 IDC 公 司 分 析 师 的 分 析 ，2010 年 世界 上 建立 的 远 端 信息 第 一 次 


字 信息 将 超过 1.8 泽 字 节 。 


- 2011 年 的 一 项 研究 提供 了 数据 存储 迅猛 增长 的 额外 数据 。 昌 据 研 究 ， 几 乎 所 有 的 公司 的 报告 数据 比 上 年 都 有 增长 ， 三 分 
之 一 的 企业 报告 数据 量 增长 比 上 年 增加 了 25% 或 更 多 。 另 外 ， 约 10% 的 数据 存储 在 PB 级 。 此 外 ，27% 的 受 访 者 表示 超过 100TB 的 
环境 ， 而 只 有 20% 的 报告 说 ， 与 以 前 的 调查 大 小 相同 。 最 终 的 结果 是 ， 企 业 存 储 的 数据 越 来 越 多 。 


- Wintet 公 司 定期 调查 最 大 和 最 频繁 使 用 的 操作 数据 库 ， 称 为 “TopTen Program” o 出 最 近 的 报告 突出 了 大 型 机 上 23TB 的 事 
务 处 理 数 据 库 ， 和 UNIX 上 100TB 的 数据 仓库 。 


Giga 研 究 小 组 进行 的 有 些 过 时 的 研究 报告 中 中 指出 : 这 个 星球 上 有 多 少数 据 ? 这 项 研究 估计 约 201000TB ， 或 约 197PB 的 数 


据 量 。 当 然 ， 这 仅 是 一 个 估计 值 ， 千 兆 的 数量 级 是 准确 的 ， 即 在 一 个 数量 级 范围 。 


事实 上 ,谈论 TB 级 和 PB 级 规模 的 数据 库 和 数据 仓库 如 今 很 常见 。 表 18-1 概 述 了 讨论 数据 存储 大 小 时 使 用 的 方式 。 但 是 ， 
中 的 数字 只 是 粗略 估计 。 有 些 人 谈 到 磁盘 存储 为 “十 的 次 方 ”， 而 不 是 “二 的 次 方 ”， 换 句 话说 ， 他 们 的 干 字 节 是 1000 字 节 ， 
而 不 是 1024 字 节 。 不 管 你 选择 什么 来 衡量 ， 硬 盘 容 量 增长 都 非常 迅速 。 


表 18-1 数据 存储 与 大 小 术语 
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存储 容量 的 增长 ， 进 一 步 增加 了 数据 和 数据 库 管 理 的 复杂 性 。 许 多 企业 都 在 实施 新 的 存储 技术 ， 如 网 络 附加 存储 (NAS) 
和 存储 区 域 网 络 (SAN) ， 帮 助 管理 日 益 增 长 的 现代 应 用 程序 所 需 的 存储 量 。 在 今天 的 动态 环境 中 管理 存储 是 一 项 非常 具有 挑 
战 的 DBA 任 务 。 


在 今天 的 动态 环境 中 管理 存储 是 一 项 非常 具有 挑战 的 DBA 任 务 。 

当 建 立 存储 系统 时 ， 要 考虑 的 目标 包括 : 

“ 防止 数据 丢失 (最 高 优先 级 ) o 

` 确保 容量 足够 ， 随 着 存储 需求 的 增长 ， 存 储 解决 方案 可 以 轻松 扩展 。 

. 选择 一 个 解决 方案 ， 能 提供 快速 数据 访问 ， 并 且 少 有 或 没有 服务 中 断 。 

. 选择 容错 存储 解决 方案 ， 当 发 生 故 障 时 ， 可 以 迅速 修复 。 

. 选择 一 个 存储 解决 方案 ， 在 添加 或 更 换 磁 盘 时 不 需要 中 断 。 

“ 结合 以 上 所 有 方案 ， 形 成 一 个 公司 可 以 负担 得 起 的 、 具 有 成 本 效益 的 存储 解决 方案 。 


现代 DBMS 磁 盘 使 用 情况 


DBA 必 须 准 备 好 应 对 磁盘 使 用 的 高 峰 。 现 代 DBMS 系 统 的 固有 功能 ， 使 它们 比 它们 的 前 华 更 容易 导致 磁盘 使 用 高 峰 。 茶 些 
DBMS 允 许 自动 扩展 和 收缩 临时 文件 的 大 小 。 根 据 数据 库 操 作 的 不 同类 型 和 性 质 ， 这 种 波动 可 能 会 导致 磁盘 使 用 高 峰 。 此 外 ,很 
多 在 线 实用 程序 操作 使 用 影子 对 象 。 因 此 ， 如 果 通 常 一 个 表 空 间 只 占用 10GB 的 磁盘 空间 ， 联 机 重组 将 需要 20GB (正常 对 象 需 
10GB ， 另 一 个 影子 对 象 需 10GB) o 


[1] www.informationweek.com/816/gerstner.htm. 

[2] www.emc.com/collateral/demos/microsites/emc-digital-universe-2011/index.htm. 

[3] “The Petabyte Challenge: 2011 IOUG Database Growth Survey, ” conducted by Unisphere Research and sponsored by Oracle. 
[4] www.wintercorp.com/WhitePapers/WC_TopTenWP. pdf. 


» 


[5] Lou Agosta, “How Much Data Is on the Planet? ” Giga IdeaByte, September20, 2000. 


18.2 ”文件 和 数据 集 


DBA 创 建 数据 库 之 前 ， 必 须 解决 许多 存储 问题 。 最 重要 的 问题 之 一 ， 是 数据 库 占 多 大 的 空间 。 数 据 文件 对 应 的 表 空 间 数据 
库 对 象 ， 如 图 18-1 所 示 。 请 记 住 ， 空 间 计 算 必 须要 考虑 的 不 只 是 表 空 间 ， 还 有 索引 ， 根 据 DBMS， 可 能 还 有 事务 日 志 。 每 一 实 
体 都 需要 一 个 单独 的 文件 或 数据 集 ， 用 于 永久 存储 。 


数据 文件 | 
表 空 间 | 
数据 库 。 


图 18-1 数据 库存 储 与 数据 文件 


确定 所 需 的 存储 量 后 ，DBA 必 须 选 择 适 当 的 存储 设备 ， 该 存储 设备 要 有 足够 的 空间 来 存储 数据 库 及 其 所 有 文件 。 针 对 不 同 
的 文件 ，DBA 可 以 选择 使 用 多 个 存储 设备 : 


DBA 可 以 选择 使 用 多 个 存储 设备 。 

. 文件 的 性 能 要 求 与 相应 的 磁盘 设备 匹配 。 

- 出 于 性 能 方面 的 考虑 ， 分 开 索 引 和 数据 。 

. 在 一 个 独立 且 非 常 快 的 设备 上 ， 隔 离 事务 日 志 。 

- 隔离 单个 卷 上 的 临时 文件 和 工作 文件 : 如 果 一 个 磁盘 发 生 错误 ， 可 以 删除 临时 文件 并 重新 定义 ， 不 受 备份 和 恢复 的 影响 。 


. 数据 分 散在 多 个 设备 上 ， 便 于 并 行 访问 。 


18.2.1 磁盘 上 的 文件 放置 


DBA 必 须 确 定 文件 在 磁盘 设备 上 的 最 佳 放置 。 有 时 ，DBA 只 需 将 文件 从 一 个 物理 磁盘 设备 转移 到 另 一 个 物理 磁盘 设备 ， 就 
可 以 实现 性 能 的 提升 。 常 用 的 方法 是 将 索引 文件 和 数据 文件 分 别 存 放 在 不 同 的 磁盘 设备 上 。 分 离 索引 与 数据 ， 使 /O 操 作 更 加 有 
效 ， 因 为 单个 磁盘 设备 的 物理 读 写 辟 不 需要 多 次 移动 。 出 于 同样 的 原因 ， 将 同一 操作 访问 的 数据 放 在 单独 的 物理 磁盘 设备 ， 是 另 


一 种 常见 的 文件 放置 技术 ， 该 技术 提供 的 性 能 优势 ， 与 数据 和 索引 分 离 提供 的 性 能 优势 相同 。 


每 行程 磁盘 技术 ， 可 用 于 最 大 化 磁盘 子 系统 的 性 能 。 总 的 想法 是 只 使 用 磁盘 的 外 侧 边 缘 ， 这 样 手 臂 不 需要 移动 太 远 ， 就 可 以 
从 盘 片 上 找到 所 需要 的 数据 。 短 行程 磁盘 技术 使 盘 片 不 用 旋转 很 多 次 就 找到 所 有 数据 。 盘 片 的 外 圈 旋 转 一 次 比 盘 片 内 图 旋转 一 次 
找到 的 数据 更 多 ( 盘 片 外 圈 的 面积 较 大 ) 。 


短 行程 磁盘 技术 使 盘 片 不 用 旋转 很 多 次 就 找到 所 有 数据 。 


当然 ， 随 着 现代 存储 设备 的 出 现 ， 确 切 的 文件 布局 正 变 得 越 来 越 不 利 。 如 果 DBMS 使 用 先进 的 存储 设备 ， 通 过 将 数据 分 散在 
多 个 物理 磁盘 (RAID) ， 创 建 一 个 虚拟 磁盘 ， 那 么 ， 明 确 的 文件 放置 就 是 在 浪费 时 间 。 即 使 DBA 指 定 两 个 不 同 的 磁盘 设备 ， 磁 
盘 阵 列 也 会 把 文件 放置 在 多 个 磁盘 上 。 所 以 ， 作 为 一 名 DBA， 当 使 用 现代 存储 阵列 技术 (如 RAID) 时 ， 就 不 要 浪费 时 间 在 精确 
的 文件 放置 了 。 


无 论 使 用 什么 类 型 的 存储 ， 一 定 要 将 事务 日 志和 数据 库 放 在 不 同 的 设备 上 ， 以 便 可 以 分 别 备 份 事务 日 志和 数据 库 。 这 是 一 个 
好 主意 ， 因 为 它 增 加 了 整体 的 可 恢复 性 。 


将 事务 日 志和 数据 库 放 在 不 同 的 设备 上 。 


Æ% 
li 


每 个 DBM SS 都 提供 不 同 的 存储 选项 。Microsoft SQL Server 提 供 了 文件 组 ，z/OS 的 DB2 提 供 了 STOGROUPS，Sybase 提 供 
TRE ( 见 “Sybase 的 分 段 ”) 。 一 定 要 了 解 你 的 DBM S 与 存储 子 系统 和 磁盘 一 起 创建 数据 库 文件 的 机 制 。 创 建 不 正确 的 数据 
库 文 件 ， 可 能 会 导致 性 能 不 佳 。 


一 些 企业 会 选择 实现 系统 管理 存储 ， 或 SMS。 有 了 SMS， 文 件 和 数据 集 的 实际 位 置 由 系统 决定 ， 而 不 是 DBA 或 存储 管理 
员 。 随 着 新 的 高 效 磁盘 技术 问世 ，SMS 变 得 更 加 可 行 。 

SMS 变 得 更 加 可 行 。 

一 种 可 能 的 情况 是 让 SMS 处 理 大 多 数 数据 库 文 件 的 放置 。 然 而 ， 对 于 某 些 性 能 敏感 的 文件 (如 事务 日 志 或 关键 任务 的 数据 


库 对 象 ) ， 需 要 使 用 非 SMS 文 件 放置 技术 。 通 过 这 种 方法 ，SMS 可 以 最 大 限度 地 减少 大 多 数 数据 库 文件 的 放置 任务 ，DBA 可 以 
只 涉及 “高 要 求 ” 的 数据 库 文 件 放置 。 


Sybase 的 分 段 


某 些 数据 库 提 供用 于 控制 表 的 大 小 的 选项 。 例 如 ，Sybase 分 段 可 以 用 来 限制 表 的 大 小 ， 因 为 一 个 表 永 远 不 可 能 大 于 它 的 段 。 
为 了 控制 表 的 增长 ，DBA 可 以 在 一 个 特定 大 小 的 特定 分 段 上 创建 表 。 该 表 将 永远 无 法 变 大 〈 不 采取 明确 的 行动 将 段 扩展 到 另 一 


个 设备 ) 。 


可 以 将 索引 和 表 分 配 到 某 些 特定 段 ， 以 提高 性 能 。 如 果 段 存放 在 单独 的 物理 磁 副 上 ， 将 非 集群 索引 放置 在 与 表 不 同 的 段 上 ， 
以 减少 磁头 争 用 。 


段 的 理想 用 途 是 隔离 大 的 、 经 常 访问 的 表 。 此 外 ， 分 段 可 用 于 跨 两 个 磁盘 分 割 单个 表 。 


18.2.2 ”原始 分 区 和 文件 系统 


当 在 基于 UNIX 的 数据 库 服务 器 上 部 署 数据 库 时 ， 原 始 分 区 是 物理 设备 的 首选 类 型 。 原 始 分 区 ， 只 是 一 个 不 带 操 作 系 统 或 文 
件 系统 的 原始 磁盘 设备 。 


原始 分 区 之 所 以 受 青睐 ， 是 因为 在 使 用 文件 系统 时 ，UNIX 缓 冲 区 的 写 入 方式 。 如 果 操 作 系统 对 写 入 进行 了 缓冲 ，DBM SS 无 
法 知道 数据 是 否 已 经 物理 复制 到 磁盘 。 这 时 ， 如 果 DBMSs 将 数据 从 缓存 写 入 磁盘 ，UNIX 很 可 能 不 会 执行 写 入 。 如 果 发 生 故 障 ， 
使 用 磁盘 系统 文件 的 数据 库 中 的 数据 可 能 无 法 100% 恢 复 。 这 应 该 要 避免 。 


如 果 使 用 原始 分 区 ， 数 据 将 会 物理 写 入 磁盘 ， 不 受 操作 系统 的 干预 。 此 外 ， 使 用 原始 分 区 ，DBMS 可 以 更 好 地 确保 有 足够 的 
空间 ， 如 果 需 要 ， 可 以 写 入 分 配 的 页 面 。 当 使 用 磁盘 文件 时 ，UNIX 不 预先 分 配 所 需 的 空间 ， 相 反 ， 它 会 创建 一 个 稀 踊 文件 。 只 
能 写 入 分 配 的 页 面 。 如 果 其 他 应 用 程序 争夺 相同 的 物理 空间 ， 你 可 能 不 会 有 足够 多 的 空间 来 存储 数据 库 中 的 数据 。 


原始 设备 的 缺点 是 数据 库 文件 很 难 跟踪 。 由 于 文件 不 使 用 操作 系统 或 文件 系统 分 配 ， 所 以 不 可 能 使 用 操作 系统 和 文件 系统 命 


在 UNIX 上 ， 事 务 日 志 一 定 要 使 用 原始 分 多， 即使 你 使 用 数据 库 文件 的 文件 系统 。 生 产 数据 库 使 用 原始 分 区 通常 是 明智 的 。 
但 是 ， 如 果 没有 完整 性 问题 (例如 ， 在 开发 环境 中 ) ， 为 了 简单 起 见 ， 可 以 在 磁盘 文件 系统 上 创建 数据 库 。 


18.2.3 ”临时 数据 库 文件 

现代 的 DBMS 都 能 够 创建 只 存在 于 特定 事务 范围 内 的 临时 数据 库 对 象 。 这 些 对 象 中 包含 的 临时 数据 非常 短暂 ， 不 需要 长 期 持 
久 性 存储 。 然 而 ， 在 它们 存在 期 间 ， 这 些 数据 库 对 象 仍 需 要 某 种 形式 的 短期 持久 性 存储 。 

临时 数据 库 对 象 需要 某 种 形式 的 短期 持久 性 存储 。 


根据 DBMS，DBA 需 要 分 配 磁 盘 设 备 和 存储 量 ， 用 于 存储 临时 数据 库 对 象 。 


18.3 ”空间 管理 


修改 数据 库 表 的 同时 ， 数 据 库 的 大 小 会 增加 。 记 住 ， 数 据 库 不 只 包括 数据 部 分 ( 表 和 索引 ) ， 而 且 还 包括 日 志 部 分 。 明 智 的 
做 法 是 定期 持续 监测 数据 库 空间 的 使 用 情况 。 这 可 以 通过 使 用 DBM S 提 供 的 工具 和 实用 程序 、 存 储 管理 软件 或 第 三 方 数据 库 工具 
来 完成 。 作 为 一 名 DBA， 你 应 该 跟踪 以 下 内 容 : 


` 次 扩展 的 数量 ; 

.设备 碎片 ; 

` 片段 使 用 信息 ; 
可 用 空间 ; 

" 段 或 分 区 的 大 小 ， 

- 每 段 分 配 的 表 和 索引 ; 
当前 未 使 用 的 预 留 空间 量 ; 


. 空间 即将 耗 尽 的 对 象 。 


DBA 经 常会 遇 到 数据 库 空间 耗 尽 的 情况 。 所 以 最 好 制订 一 项 计划 来 应 对 数据 库 的 增长 。 第 一 步 是 定期 删除 未 使 用 的 数据 库 
对 象 ， 回 收 空间 。 有 了 时， 创建 了 一 个 对 象 却 就 从 没有 使 用 过 。 删 除 未 使 用 的 数据 库 对 象 ， 就 可 以 释放 其 占用 的 空间 。 


如 果 不 存 在 未 使 用 的 数据 库 对 象 ，DBA 必 须 扩 大 可 用 于 数据 库存 储 的 空间 。 通 常 ， 通 过 使 用 ALTER 语 句 为 数据 库 对 象 指定 额 
外 的 空间 。DBA 也 要 为 使 用 的 数据 库 对 象 分 配 一 个 额外 的 存储 设备 ， 这 可 能 涉及 将 数据 库 对 象 的 文件 从 一 个 设备 转移 到 另 一 个 
设备 。 当 使 用 ALTER 语 句 为 数据 库 对 象 指定 额外 的 空间 时 ， 一 定 要 特别 小 心 。 有 些 DBMS 要 求 DBA 指 定 增加 多 少 存 储 空间 ， 有 些 
DBMS 需 要 一 个 新 的 总 体 大 小 的 规范 。 


18.3.1 数据 页 面 布局 


每 个 DBMS 都 使 用 不 同 的 格式 来 布局 数据 库 对 象 的 页 面 。 但 是 ， 通 常情 况 下 ， 一 个 数据 库 对 象 的 页 面 布局 包括 三 个 基本 组 成 
部 分 ， 如 图 18-2 所 示 。 


图 18-2 ”数据 页 面 布局 示例 


* 页 头 。 数 据 库 页 的 开始 部 分 ， 将 包含 几 个 字 节 的 物理 “内 务 ” 的 信息 。 页 头 可 包括 一 个 页 面 标识 符 ， 向 前 和 向 后 链接 到 其 
他 数据 页 ， 标 识 符 指明 页 面 属于 哪个 表 、 自 由 空间 指针 和 表 的 最 小 行 的 长 度 。 


- 数据 行 。 页 面 也 包括 含有 用 户 数据 的 表 (或 索引 ) 的 实际 行 。 行 不 会 跨越 页 边界 ， 除 了 菜 些 大 型 数据 类 型 ， 如 文本 、 图 像 
和 其 他 二 进 制 大 对 象 。 


. 偏 移 表 。 偏 移 表 可 能 与 指向 数据 页 面 上 的 每 个 数据 行 的 指针 共存 。 一 些 DBMS 总 是 使 用 某 种 形式 的 偏 移 表 ， 而 另 一 些 只 在 


数据 页 上 存在 可 变 长 度 行 时 才 使 用 偏 移 表 。 

请 记 住 ， 页 面 组 件 的 实际 布局 和 长 度 因 DBMS 的 不 同 而 不 同 。 另 外 ， 可 以 存储 在 数据 库 页 的 行 的 数量 取决 于 页 的 大 小 。 一 些 
DBMS 需 要 数据 库 对 象 的 页 面 大 小 固定 ， 而 另 一 些 则 人 允许 DBA 指 定 页 面 大 小 。 
分 配 页 


除了 数据 页 ，DBMS 将 使 用 另 一 种 类 型 的 页 面 来 控制 空 的 使 用 。 分 瑟 页 有 时 也 称 作 空 间 映 射 页 ， 由 DBMS 用 于 管理 数据 库 对 
象 中 的 其 他 页 面 。 数 据 库 中 可 以 存在 多 个 分 配 页 ， 每 一 个 控制 一 块 其 他 的 数据 页 。 这 些 块 通常 称 为 分 配 单元 。 


DBMS 使 用 分 配 页 管理 数据 库 对 象 中 的 其 他 页 面 。 


分 配 页 控制 物理 页 。 每 个 物理 页 面 映 射 到 一 个 数据 库 。 物 理 页 面 在 磁盘 上 不 一 定 是 连续 的 ， 事 实 上 ， 经 常 不 连续 。 分 配 单元 
主要 使 用 位 图 来 管理 页 面 的 分 配 。 位 图 包含 了 一 系列 位 ， 或 开 (“1”) 或 关 (“0”) ， 每 个 位 代表 分 配 单元 内 的 页 面 ， 还 代 
表 页 面 中 的 空间 是 否 可 用 。DBMS 使 用 此 信息 促进 数据 的 修改 过 程 。 目 前 DBMS 可 以 使 用 多 个 位 图 来 管理 分 配 、 回 收 和 空间 使 用 
情况 。 分 配 页 与 典型 的 数据 页 面 的 格式 明显 不 同 。 


当 DBA 计 算 管 理 数据 库存 储 使 用 的 空间 时 ， 必 须 将 分 配 页 考虑 进去 。DBA 需 要 知道 受 分 配 页 控制 的 每 个 分 配 单位 的 页 面 数 
量 。 然 后 将 其 加 入 到 数据 库 空 间 使 用 的 计算 中 去 。 


数据 记录 布局 


表 由 行 和 列 组 成 。 每 个 列 必须 完全 存储 在 单个 数据 页 上 (除了 DBMS 的 一 些 大 数据 对 象 ) 。 每 一 行 都 包含 在 一 个 记录 中 ， 该 
记录 包含 额外 的 内 务 数 据 和 该 行 的 实际 数据 内 容 。 每 个 表 的 记录 包括 以 下 元 素 : 


森 


. 行头 。 每 个 记录 的 开头 通常 是 几 个 字 节 的 物理 “内 务 ” 信 息 ， 详 细 描 述 了 该 行 数据 内 容 的 结构 和 组 成 。 这 可 能 包括 行 的 
度 、 可 变 长 度数 据 的 信息 和 其 他 控制 结构 。 


行 数据 。 这 包括 该 行 所 有 数据 列 的 实际 数据 内 容 。 根 据 DBMS， 可 变 和 固定 长 度 列 可 以 分 开 。 
* 偏 移 表 。 可 选 ， 记 录 可 能 包含 偏 移 表 、 指 针管 理 和 控制 行内 存储 的 可 变 长 字段 。 


记录 包含 菜 行 的 数据 内 容 和 内 务 数据 。 


SS 


页 计算 记录 的 长 度 ， 而 不 是 行 的 长 度 。 记 录 的 长 度 包括 表 头 和 偏 移 表 的 开销 ， 而 行 长 
能 够 准确 地 计算 行 的 长 度 ， 因 为 行 的 长 度 是 整个 记录 长 度 的 一 个 组 成 部 分 。 


当 计 算 表 所 需 的 存储 空间 时 ，DBA 必 
度 只 是 表 中 每 一 列 的 长 度 。 当 然 ，DBA 必 


党 


要 计算 行 的 数据 长 度 ，DBA 需 要 用 到 一 个 文档 ， 该 文档 概述 以 什么 方式 确定 DBMS 支 持 的 每 种 数据 类 型 的 实际 物理 长 度 。 存 
储 这 些 数 据 类 型 的 列 的 实际 数据 类 型 和 长 度 因 DBMS 不 同 而 不 同 。 下 面 的 公式 可 用 作 计 算 行 的 物理 大 小 的 一 般 准 则 : 


Fixed-length rows: 
Row Size = Length (COL1) 


十 Length (COLn) 


Variable-length rows: 
Row Size = Length (FIXED COL1) 


+ Length (FIXED COLn) 
+ Average [Length(VAR COL1)] 


+ Average [Length(VAR COLn)] 


列 的 长 度 依赖 该 列 的 数据 类 型 ,每 个 DBMS 都 会 记录 其 支持 的 数据 类 型 的 长 度 。 要 计算 整个 记录 的 长 度 ， 需 要 找到 所 有 行 
(可 变 或 固定 长 度 ) 的 类 型 所 需 的 长 度 ， 并 将 其 添加 到 计算 中 。 


列 的 长 度 依赖 该 列 的 数据 类 型 。 
计算 表 大 小 


知道 了 页 面 的 布局 ，DBA 就 可 以 准确 地 计算 出 记录 的 长 度 ， 然 后 就 可 以 很 容易 地 计算 出 一 个 表 的 大 小 。 计 算出 记录 的 长 度 
以 后 ,下 一 步 是 确定 一 个 物理 页 有 多 少 行 。 页 面 大 小 因 DBMS 不 同 而 不 同 ， 大 多 数 DBMS 人 允许 DBA 指 定 不 同 的 页 面 大 小 。 


页 面 的 大 小 因 DBMS 不 同 而 不 同 。 


例如 ， 假 设 单个 页 面 有 4KB 的 存储 空间 ， 但 32B 用 于 元 余 开 销 ( 表 头 信息 ) 。 剩 余 4064B 可 以 存储 所 有 的 数据 行 。 使 用 下 面 
的 公式 计算 单个 数据 页 可 容纳 的 行 数 : 


4064 


Rows per page 一 一 
Row size 


以 下 公式 可 以 计算 表 所 需 的 总 空间 量 : 


四 Number of rows 
Table size (in K) = ——————————_ x (4K) 
Rows per page 


当然 ，DBA 需 要 考虑 为 表 指 定 的 自由 空间 。 此 外 ， 记 得 考虑 存储 在 外 部 的 数据 ， 如 SQL server 的 文本 列 或 (ABE) DB2 
的 LOB 列 。 


18.3.2 索引 页 面 布局 
如 果 一 个 表 没有 定义 索引 ， 行 可 以 添加 在 表 的 末尾 。 如 果 最 后 一 个 页 面 没有 额外 的 空间 插入 新 行 ， 就 需要 一 个 新 页 面 (分 配 
或 创建 ) 。 非 索引 表 的 各 个 数据 页 面 通过 向 前 和 向 后 指针 连 在 一 起 。 遍 历 链 表 即 按 顺 序 访问 数据 页 面 。 


适用 于 数据 记录 的 限制 ， 同 样 也 适用 于 存储 在 索引 中 的 记录 。 单 个 索引 行 必须 完全 存储 在 单个 索引 页 面 。 典 型 的 索引 记录 包 
HELA FJUR: 


: 头 信息 。 与 数据 页 面 一 样 ， 每 个 索引 记录 的 开头 通常 也 是 几 个 字 节 的 物理 “内 务 ” 信 息 ， 详 细 描 述 索引 记录 的 结构 和 组 


: 行 的 长 度 。 对 于 可 变 长 度 密 钥 ， 索 引 需 要 存储 索引 数据 的 实际 长 度 。 
:索引 键 值 。 索 引 键 的 实际 数据 的 值 ， 按 定义 的 顺序 列 出 。 
- 页 面 指针 。 指 向 实际 保存 索引 数据 的 表 的 数据 页 面 的 物理 位 置 。 
. 偏 移 和 调整 表 。 这 可 能 需要 管理 和 控制 存储 在 索引 行 的 可 变 长 字段 的 位 置 。 
单个 索引 行 必须 完全 存储 在 单个 索引 页 面 。 
索引 记录 的 指针 的 组 成 取决 于 该 索引 是 集群 索引 还 是 非 集群 索引 。 集 群 索引 只 需要 一 个 数据 页 面 指针 。 非 集群 索引 需要 数据 
页 面 指针 和 该 数据 页 面 中 数据 行 的 位 置 指针 。 
计算 索引 大 小 
计算 存储 索引 所 需 空间 的 第 一 步 是 使 用 下 列 公式 计算 索引 的 行 的 大 小 : 


Fixed-length index keys: 
Row Size = Length (KEY-COL1) 
+ Length (KEY-COLn) 
Variable-length index keys: 
Length (FIXED-KEY-COL]1) 


Row Size 


Length (FIXED-KEY-COLn) 
+ Average [Length (VAR-KEY-COL])] 


+ Average [Length (VAR-KEY-COLn)] 
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需要 获得 你 使 用 的 DBMS 中 所 有 索引 所 需 的 行 的 开销 的 大 小 。 


小 


你 需要 计算 索引 记录 的 大 小 ， 而 不 只 是 行 的 大 小 。 


一 旦 计算 出 了 记录 的 大 小 ， 就 可 以 进行 下 一 个 步骤 ， 即 计算 索引 所 需 的 存储 空间 。 首 先 使 用 下 面 的 公式 得 出 单个 索引 页 面 可 
以 容纳 的 记录 数 : 


Entries per page = (Block size - Overhead) 


+ Row size 


然后 ， 可 以 使 用 下 面 的 公式 得 出 该 索引 所 需 的 总 空间 量 : 


First-level pages = Number of rows 

+ Entries per page 
First-level size = First-level pages 

x (Block size - Page overhead) 
Second-level pages =  First-level pages 

+ Entries per page 
Second-level size = Second-level pages 

x (Block size - Page overhead) 
Third-level pages = Second-level pages 

+ Entries per page 
Third-level size =  Third-level pages 


x (Block size - Page overhead) 


继续 迁 代 直到 页 面 数 为 1 或 更 小 。 至 此 ， 就 到 达 了 索引 的 根 级 别 。 每 个 级 别 的 大 小 加 在 一 起 为 存储 索引 所 需 的 总 空间 量 。 


18.3.3 ”事务 日 志 


数据 库 处 理 的 最 重要 的 文件 之 一 是 事务 日 志 。 每 次 插入 、 更 新 和 删除 任何 数据 库 表 ， 都 需要 记录 在 事务 日 志 中 。 计 算出 事务 
日 志 的 确切 大 小 更 像 是 一 门 艺术 ， 因 为 事务 活动 本 质 上 是 随机 的 。 


计算 出 事务 日 志 的 确切 大 小 更 像 是 一 门 艺术 。 


要 确定 一 个 事务 日 志 的 确切 大 小 ， 数 据 库 活动 是 最 重要 的 因素 。 一 个 好 的 经 验 法 则 是 为 日 志文 件 提供 足够 的 空间 ， 捕 获 在 最 
繁忙 的 处 理 周 期 内 不 同 的 日 志 归 档 之 间 发 生 的 所 有 数据 库 修 改 。 最 棘手 的 部 分 是 确定 最 活跃 的 处 理 周期 和 数据 库 修 改 对 日 志 的 影 
响 。 无 论 如何 ， 如 果 不 自动 归档 或 备份 数据 库 日 志 ， 你 应 该 密切 关注 数据 库 日 志文 件 的 大 小 。 否 则 ， 可 能 会 导致 数据 无 法 恢复 或 
处 理 变 慢 或 完全 停止 。 


DBA 必 须 指定 影响 磁盘 使 用 率 的 其 他 数据 库 日 志 参 数 。 大 多 数 DBMS 都 支持 多 个 元 余 日 志 。DBA 必 须 决定 应 该 有 多 少 事务 
日 志 ， 应 该 将 它们 分 配 在 哪个 磁盘 设备 上 。 最 低 限度 ， 也 应 该 运行 双重 活动 日 志 ， 这 样 ， 一 个 日 志 出 现 问 题 不 会 关闭 DBMS 操 
作 ， 因 为 还 有 其 他 活动 日 志 可 用 。 


男 一 个 要 考虑 的 是 归档 日 志 在 磁盘 上 保留 多 长 时 间 。 对 于 一 些 实现 ， 日 志 可 以 直接 保存 到 磁盘 上 。 然 而 ， 从 效率 的 角度 来 
看 ， 先 将 日 志 归档 到 磁盘 然后 转 到 磁带 更 有 意义 。 作 为 一 个 经 验 法 则 ， 可 以 考虑 将 归档 日 志 在 磁 盘 上 至 少 保留 24 小 时 。 此 外 ， 
你 可 以 根据 系统 在 最 繁忙 的 一 天 中 的 吞吐 量 来 计算 所 需 的 磁盘 空间 ， 确 保有 足够 的 磁盘 空间 来 容纳 归档 日 志 。 


18.4 ”碎片 和 存储 


碎片 是 性 能 和 存储 需求 的 敌人 。 但 是 ， 碎 片 是 什么 ”常见 的 定义 是 整个 磁盘 中 文件 的 分 散 部 分 ， 如 操作 系统 将 一 个 文件 分 解 
并 将 每 个 部 分 放 到 已 经 删除 了 的 文件 的 各 个 空间 。 有 几 种 碎片 ， 需 要 DBA 监 测 和 纠正 。 


碎片 是 性 能 和 存储 需求 的 敌人 。 


磁盘 碎片 可 能 会 影响 某 些 系统 的 性 能 。 磁 盘 碎 片 发 生 在 操作 系统 级 别 ，DBA 必 须 能 够 使 用 OS 工具 来 分 析 数 据 库 驻 留 的 驱动 
器 。 一 个 好 的 做 法 是 ， 先 纠正 磁盘 碎片 ， 然 后 在 小 规模 的 传统 MO 子 系统 的 环境 中 ， 运 行 DBM 提供 的 碎片 整理 工具 。 在 受益 于 
更 加 智能 的 磁盘 子 系统 的 大 型 环境 中 ， 可 能 不 需要 纠正 磁盘 碎片 。 


索引 碎片 是 DBA 比 较 担忧 的 问题 。 第 11 章 中 对 此 进行 了 深入 的 讨论 。 当 添加 、 修 改 或 从 创建 索引 的 表 中 删除 数据 时 ， 索 引 
会 变 得 杂乱 无 章 且 极 其 分 散 。 索 引 碎 片 由 许多 分 散 的 存储 区 域 组 成 ， 它 们 太 小 不 能 重新 加 以 利用 。 这 会 导致 空间 的 浪费 ， 从 而 引 
起 性 能 下 降 ， 存 储 成 本 增加 。 可 以 影响 存储 使 用 率 的 其 他 情况 包括 集群 数据 、 页 面 拆 分 和 行 链接 。 


碎片 会 影响 性 能 ,不仅 因 为 数据 的 位 置 不 理想 ， 还 因为 数据 库 为 预 读 处 理 读 取 引 擎 扫描 索引 时 ， 碎 片 会 导致 额外 的 数据 页 扫 
描 到 | 数据 缓存 ， 从 而 降低 性 能 。 


DBA 应 该 使 用 工具 [扫描 数据 库 索 引 的 碎片 ， 重 整 磁盘 或 定期 重建 索引 。 这 样 不 仅 可 以 提高 性 能 ， 也 会 减少 索引 所 需 的 存 


储量 。 


[1] 或 者 DBMS 提 供 的 工具 ， 或 者 从 第 三 方 供应 商 处 购买 的 工具 。 


18.5 ”存储 选项 


一 旦 计算 出 数据 库 文件 所 需 的 存储 量 ， 接 下 来 就 需要 选择 要 使 用 的 存储 类 型 。 基 于 容错 、 性 能 需求 和 预算 ，DBA 有 几 个 存 
储 选项 可 以 选择 。 


数据 库 文件 所 使 用 的 主 存储 介质 是 直接 访问 磁盘 驱动 器 。 但 其 他 类 型 的 介质 如 固态 设备 (SSD) ， 也 称 为 固态 驱动 器 、 固 态 
硬盘 或 电子 盘 。SSD 采 用 固态 存储 的 方式 用 类 似 硬盘 驱动 器 的 方式 来 存储 持久 数据 。 但 因为 SSD 使 用 内 存 而 不 是 磁盘 ， 是 机 械 设 
备 有 移动 部 件 ， 因 此 大 大 提升 了 MO 性 能 。 


尽管 SSD 超 越 了 传统 的 磁盘 ， 不 易 受 物理 损坏 ， 但 相对 其 能 力 而 言 ， 价 格 相当 昂贵 。 
SSD 超 越 了 传统 磁盘 ， 不 易 受 物理 损坏 ,但 相对 其 能 力 而 言 ， 价 格 相当 昂贵 。 


某 些 DBMS 产 品 ， 称 为 主 内 存 数 据 库 管理 系统 (MMDBMS) ， 专 门 设计 用 于 永久 存储 内 存 中 的 数据 。 其 中 最 流行 
的 ，TimesTen 和 SolidDB， 分 别 由 Oracle (2005 年 ) 和 IBM (2008 年 ) 研发 。 昌 然 MMDBMS 产 品 的 普及 程度 在 2005 年 有 所 上 
升 ， 但 看 上 去 MMDBMSs 越 来 越 像 专门 发 行 ， 因 为 传统 的 DBMs 加 上 ssD 可 以 产生 类 似 的 结果 。 


磁带 也 是 存储 选项 ， 如 光盘 ， 但 这 些 是 WORM (一 次 写 入 ， 多 次 读 取 ) 技术 。 磁 带 主要 用 于 备份 ， 而 光盘 是 专门 技术 ， 主 
要 用 于 备份 和 离线 数据 存储 。 


下 面 回 到 磁盘 。 磁 盘 设备 是 DBA 用 于 持久 性 数据 人 存储 的 主要 存储 工具 。 磁 盘 驱 动 器 专 为 直接 读 写 访 问 而 设计 ， 符 合成 本 效 
益 ， 并 能 够 存储 非常 大 的 数据 量 。 有 些 磁盘 设备 相对 慢 一 些 ， 小 一 些 。 但 是 ， 有 无 数 种 速度 、 容 量 和 价格 的 磁盘 驱动 器 存 企 ,能 
满足 几乎 任何 类 型 的 存储 需求 。 


磁盘 设备 是 持久 性 数据 存储 的 主要 存储 工具 。 


18.5.1 RAID 


简单 的 介质 故障 中 断 可 通过 实施 现代 磁盘 技术 (如 RAID) 来 避免 。RAID， 即 独立 磁盘 宛 余 阵列 的 缩写 ， 结 合 多 个 磁盘 设备 
到 一 个 阵列 ， 系 统 作为 单个 磁盘 驱动 器 来 感知 。RAID 技 术 有 很 多 级 别 ， 提 供 不 同 程度 的 容错 和 性 能 。 


RAID 结 合 多 个 磁盘 设备 到 一 个 阵列 中 。 


RAID 阵 列 的 另 一 个 可 取 方 面 是 它们 使 用 热 插 拔 硬盘 的 能 力 ， 阵 列 不 必 断 电 来 更 换 出 现 故 障 的 驱动 器 。 更 换 驱 动 器 的 同时 ， 
阵列 能 够 正常 运行 ， 这 对 于 需要 一 边 管理 数据 库 一 边 提供 不 间断 的 数据 可 用 性 的 DBA 更 是 一 大 好 处 。 


RAID 级 别 


RAID 有 几 个 不 同 的 级 别 。 供 应 商 为 已 定义 的 RAID 级 别提 供 不 同 程度 的 支持 。 这 些 不 同 级 别 的 RAID 为 镜像 、 条 带 化 和 奇偶 
的 功能 组 合 提供 连续 可 用 性 。 镜 像 发 生 的 条 件 是 在 至 少 两 个 磁盘 驱动 器 上 制作 数据 的 完整 副本 ， 当 数据 变更 时 ， 两 个 副本 也 同时 
变更 。 如 果 其 中 一 个 出 现 故 障 ， 访 问 会 自动 转移 到 其 余 的 副本 。 数 据 子 集 在 多 个 磁盘 驱动 器 分 布 时 发 生 条 带 化 。 如 果 任 何 一 个 驱 
动 器 发 生 故 障 ， 故 障 的 影响 限制 在 该 磁盘 的 条 带 内 的 数据 。 最 后 ， 奇 偶 校 验 位 是 编码 数据 ， 一 旦 驱动 器 发 生 故 障 ， 全 部 或 部 分 数 
据 不 能 访问 时 ， 可 用 来 重建 原始 数据 。 丢 失 的 数据 可 以 立即 重建 ， 并 将 其 重新 写 入 未 损坏 的 磁盘 。 


供应 商 为 RAID 级 别提 供 不 同 程度 的 支持 。 


RAID-0 (图 18-3) 也 通常 称 作 磁盘 条 带 化 。 使 用 RAID-0， 数 据 分 割 到 多 个 驱动 器 ， 可 以 提供 更 高 的 数据 吞吐 量 。 然 而 ， 没 
ATR (这 真 的 不 适合 RAID 缩 写 的 定义 ) 。 因 为 没有 存储 多 余 的 数据 ， 性 能 通常 会 很 好 ， 但 阵列 中 任何 磁盘 故障 都 会 导致 数据 
丢失 。 所 以 在 关键 任务 的 实现 中 应 该 避免 RAID-0。 


Ren 
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图 18-3 RAID-0 


RAID-1 (图 18-4) ， 有 时 也 称 作 数据 镜像 ， 提 供 了 元 余 ， 因 为 所 有 的 数据 写 入 两 个 或 多 个 驱动 器 。RAID-1 阵 列 一 般 比 单个 
驱动 器 读 取 数 据 时 会 有 更 好 的 表现 ， 但 数据 写 入 时 却 表现 一 般 。 但 是 ，RAID-1 提 供 元 余 ， 因 此 ， 当 任何 驱动 器 发 生 故 障 时 ， 数 
据 都 不 会 丢失 。 
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图 18-4 RAID-1 


RAID-2 (图 18-5) 提供 纠 错 编码 。RAID-2 只 对 没有 任何 内 置 错误 检测 的 驱动 器 有 用 。 没 有 商业 RAID-2 实 现存 在 ， 因 为 它 
不 是 一 种 商业 上 可 行 的 技术 。 


RAID-3 (图 18-6) 条 带 数 据 在 字 节 级 跨 多 个 驱动 器 ， 将 奇偶 校 验 存储 在 一 个 硬盘 上 。RAID-3 为 读 和 写 提 供 了 很 好 的 数据 传 
输 率 ， 但 它 需要 相当 复杂 的 控制 器 来 实现 。 


RAID-4 (图 18-7) 条 带 数 据 在 多 个 驱动 器 上 的 块 级 别 ， 将 奇偶 校 验 存储 在 单个 驱动 器 上 。 对 于 RAID-3 和 RA1D-4， 奇 偶 校 
验 信息 可 以 从 任何 单个 驱动 器 故障 中 恢复 。RAID-4 的 写 入 性 能 可 能 会 很 慢 ， 并 且 一 旦 RAID-4 磁 盘 发 生 故 障 ， 数 据 可 以 重建 。 
RAID-4， 也 需要 复杂 的 控制 器 设计 。 
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图 18-5 RAID-2 


Stripe 0 Stripe 1 Stripe 2 Stripe 3 
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图 18-6 RAID-3 


Blocks 0, 1,2, 3 Parity 
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图 18-7 RAID-4 


RAID-5 (图 18-8) 与 RAID-4 类 似 ,但 它 在 驱动 器 之 间 分 布 奇偶 校 验 信息 。 对 多 处 理 器 系统 中 的 小 型 写 入 ，RAID-5 可 以 超 
越 RAID-4， 因 为 奇偶 校 验 磁盘 不 会 成 为 铂 颈 。 然 而 ， 读 取 性 能 会 受到 影响 ， 因 为 奇偶 校 验 信息 在 几 个 磁盘 上 。 


Party 
Generation 
Server 
A Blocks B Blocks C Blocks D Blocks E Blocks 


iale 
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图 18-8 RAID-5 


RAID-6 (图 18-9) 基本 上 是 RAID-5 的 一 个 扩展 ， 但 它 通 过 使 用 第 二 个 独立 分 布 式 校 验方 案 ， 提供 了 额外 的 容错 。RAID-6 


的 写 性 能 较 差 。 


D3 


XOR Parity | Reed-Solomon 
Generation (P) | ECC Code 
Generation (Q) 


A Blocks B Blocks C Blocks D Blocks 
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图 18-9 RAID-6 
RAID-10 (图 18-10) 是 一 个 条 带 阵列 ， 其 中 每 个 段 都 是 一 个 RAID-1 阵 列 。 因 此 ， 它 提供 了 与 RAID-1 相 同 的 容错 。RAID- 
10 可 以 提供 高 性 能 和 可 靠 性 ， 所 以 它 非常 适合 高 性 能 的 数据 库 处 理 。 但 是 ，RAID-10 非 常 昂贵 。RAID-10 是 要 求 高 性 能 和 容错 的 
数据 库 实 现 的 理想 解决 方案 。 


RAID-50 (图 18-11) 是 个 条 带 阵 列 ， 其 中 每 个 段 都 是 一 个 RAID-3 阵 列 。RAID-50EKRAID-5 有 更 高 的 容错 能 力 ， 但 校 验 开 
销 是 它 的 两 倍 。RAID-50 因 需求 小 ， 可 以 达到 很 高 的 数据 传输 率 和 很 高 的 /O 率 ， 但 实现 起 来 相当 昂贵 。 


上 
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图 18-10 RAID-10 
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图 18-11 RAID-50 


RAID-0+1 (图 18-12) 结合 了 RAID-1 的 镜像 和 RAID-0 的 条 带 化 。 因 此 ， 它 结合 了 RAID-0 的 高 性 能 和 RAID-1 的 可 靠 性 。 


RAID 
Controller 
Server 
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图 18-12 RAID-0+1 


存储 供应 商 已 经 定义 了 一 些 RAID 的 专 有 变 体 和 级 别 。 如 果 要 购买 RAID 存 储 ， 确 保 你 了 解 存储 供应 商 到 底 提 供 了 什么 。 欲 了 
解 更 多 详情 ， 请 参阅 http://en.wikipedia.org/wiki/RAID。 


为 数据 库 文件 选择 适当 的 RAID 存 储 类 型 是 DBA 工 作 的 一 个 重要 方面 。 选 择 的 RAID 级 别 ， 将 直接 影响 数据 库 解决 方案 的 性 能 
和 可 靠 性 。 当 为 数据 库 文件 评估 RAID 存 储 解决 方案 时 ， 将 成 本 因素 考虑 进 解 决 方案 的 选择 标准 中 是 必 不 可 少 的 。 表 18-2 对 每 个 
级 别 RAID 的 容错 、 性 能 和 成 本 进行 了 对 比 。 
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请 记 住 ， 每 个 DBM 都 使 用 数据 文件 、 索 引文 件 和 事务 日 志文 件 ， 其 中 每 个 服务 不 同 的 目的 ， 并 维持 不 同 级 别 的 读 取 和 写 入 
活动 。 不 同类 型 的 人 存储， 根据 不 同类 型 的 文件 及 其 所 需 的 不 同类 型 的 访问 来 预算 和 采购 。 例 如 ， 针 对 日 志文 件 的 写 入 活动 往往 是 
连续 的 ， 所 以 将 日 志文 件 隔离 到 可 以 最 大 化 写 入 性 能 的 磁盘 系统 上 很 有 意义 。 因 为 日 志文 件 的 活动 主要 是 写 活动 ， 你 应 该 倾向 快 
写 RAID 级 别 ， 如 RAID-0+1 或 RAID-0。RAID-0+1 最 优 ， 但 成 本 太 高 ， 所 以 很 多 企业 决定 采用 降低 写 入 性 能 和 容错 的 RAID-1。 


当 评 估 RAID 或 任何 类 型 的 磁盘 系统 时 ， 你 必须 对 你 的 数据 库 系统 和 应 用 程序 的 可 靠 性 和 性 能 要 求 进 行 预算 平衡 。 你 的 数据 
库 文件 的 最 佳 磁盘 配置 可 能 需要 多 个 不 同 级 别 的 RAID 阵 列 。 但 是 ， 为 了 进行 评估 ， 考 虑 以 下 建议 : 


* 倾向 于 选择 数据 库 文件 的 容错 RAID 级 。 非 容错 磁盘 上 的 数据 库 文件 会 导致 停机 和 数据 丢失 。 


- 为 每 个 数据 库 对 象 将 经 历 的 活动 类 型 ， 选 择 适 当 的 磁盘 系统 。 例 如 ， 想 实现 两 个 独立 的 RAID 系 统 ， 一 个 在 RAID-5， 针 对 
大 量 数据 读 取 ， 如 分 析 和 报告 ， 另 一 个 在 RAID-1 (或 RAID-0+1) 针对 频繁 写 入 和 更 新 的 事务 数据 。 


对 高 性 能 ， 有 足够 预算 的 关键 任务 实现 ， 可 以 考虑 RAID-10 的 性 能 和 容错 。 


如 果 你 手 上 有 预 工 ， 考 虑 RAID-0+1， 因 为 快速 读 写 和 容错 能 力 。 


18.5.2 JBOD 


JBOD 代 表 简 单 磁盘 捆绑 。 


JBOD 代 表 简 单 磁盘 捆绑 ， 是 一 个 术语 ， 用 来 区 分 传统 的 磁盘 技术 与 新 的 存储 技术 。 通 常情 况 下 ， 磁 盘 直 接连 接 到 服务 器 。 
一 旦 这 些 磁盘 驱动 器 上 安装 了 DBMS， 就 可 以 使 用 DBMS 的 工具 在 这 些 磁盘 驱动 器 上 创建 数据 库 文件 。 


但 是 ， 由 于 数据 库 环境 越 来 越 复 杂 ， 存 储 的 需求 也 越 来 越 复杂 。 随 着 数据 库 的 环境 的 复杂 性 日 益 增 加 ，DBA 可 能 需要 考虑 
其 他 存储 技术 ， 如 SAN 和 NAS。 


18.5.3 ”存储 区 域 网 络 


存储 区 域 网 络 (SAN) ， 一 般 指 互相 连接 的 网 络 中 的 存储 设备 。 但 是 ，SAN 没 有 一 个 标准 的 行业 定义 ， 不 同 的 人 有 不 同 的 
定义 。 一 些 人 认为 ，SAN 包 括 光 纤 通 道 交 换 机 中 的 任何 东西 。 另 一 些 人 则 将 SAN 定 义 为 采用 光纤 通道 技术 的 两 个 或 更 多 主机 系 
统 。 不 管 如 何 定义 ，SAN 都 可 以 提供 高 速 和 高 可 用 性 。 


SAN 没 有 一 个 行业 的 标准 定义 。 


光纤 通道 是 一 种 串 行 接口 ， 可 提供 传输 速率 高 达 105MB/s。 光 纤 通 道 是 一 种 有 竞争 力 的 技术 SCS1， 即 小 型 计算 机 系统 接 
口 ，SCSI 发 言 是 “scuzzy”。SCSl 是 一 种 并 行 接口 ， 可 以 提供 从 40MB/s 到 最 高 160MB/s 的 超 SCSI 传 输 速率 。 但 是 ，SCSI 维 修 
或 添加 人 存储 设备 会 造成 很 长 的 停机 时 间 。 光 纤 通 道 因 添加 和 删除 设备 不 中 断 连 接 ， 从 而 可 以 提供 更 好 的 容错 。 


SAN 可 以 提供 以 下 好 处 : 
` 在 多 个 主机 之 间 共 享 存 储 。 
.高 I/O 性 能 。 


. 服务 器 和 存储 整合 。 


18.5.4 网 络 附加 存储 


网 络 附加 存储 (NAS) ， 是 指 可 以 直接 从 网 络 访问 的 存储 。 有 了 NASs， 主 机 或 客户 端 系统 可 以 通过 网 络 接口 ， 使 用 协议 
[NFS (网 络 文件 系统 ) 和 CIFS (通用 互联 网 文件 系统 ) ] ， 通 过 一 个 网 络 接口 〈 如 以 太 网 、FDDI 或 其 他 ) 读 取 和 写 入 数据 。 
实现 NASs 可 以 使 用 文件 服务 器 ， 运 行 NAS 软 件 的 主机 系统 ， 或 称 为 电器 的 瘦 服 务 器 。 


NAS 可 以 提供 以 下 好 处 : 

在 多 个 主机 之 间 共 享 存储 ; 

" 由 于 减少 重复 存储 ， 管 理 更 简单 ， 

- 基于 应 用 程序 的 存储 在 文件 级 访问 。 


传统 系统 要 么 使 用 直接 连接 到 系统 的 内 部 或 外 部 人 存储， 要 么 使 用 共享 存储 器 ， 如 大 型 企业 阵列 。 旧 的 接口 (如 SCSI 和 
ESCON) 存在 性 能 和 距离 的 限制 。 最 常用 的 NAS 软 件 是 Windows 和 Linux 系 统 的 NFS (网 络 文件 系统 ) 和 CIFS。 


SAN 与 NAS 


SAN 最 好 用 作 存 储 骨 干 ， 为 主机 系统 和 NAS 服 务 器 提供 基本 的 存储 服务 。SAN 非 常 适合 共享 存储 ， 为 服务 器 和 存储 整合 建 
立 基 础 设施 。SAN 技 术 适 合 要 求 高 性 能 或 大 容量 的 应 用 程序 。 因 为 它 可 以 提供 高 性 能 和 低 延 时 ，SAN 是 数据 库 应 用 程序 的 理想 


选择 o 


NAS 更 适合 解决 多 媒体 存储 问题 、 数 据 共享 问题 和 较 小 系统 的 共享 存储 。NAS 对 数据 库 系统 所 使 用 的 基于 块 的 存储 不 太 有 
效 。 


不 要 犯 这 样 的 错误 : 无 论 SAN 或 NAS， 强 制 所 有 的 存储 都 是 一 种 类 型 。 每 个 数据 库 和 应 用 程序 的 访问 和 修改 需求 匹配 其 存 
储 要 求 。 你 可 以 将 SAN 和 和 NAS 组合 使 用 来 解决 数据 的 存储 和 业务 需求 。 


不 要 犯 这 样 的 错误 : 强制 所 有 的 存储 都 是 一 种 类 型 。 


18.5.5 “分 层 仓储 


可 用 于 数据 库 文件 仓储 的 最 后 一 个 选项 是 分 层 人 存储 。 通 过 分 层 人 存储， 将 不 同类 别 的 数据 分 配 到 不 同类 型 的 存储 介质 ， 从 而 可 
以 降低 总 存储 成 本 。 这 种 做 法 对 需要 管理 持续 增长 的 大 量 数 据 的 企业 很 重要 。 活 动 系统 必须 管理 的 数据 越 多 ， 管 理 的 成 本 就 越 
高 。 分 层 人 存储 可 以 帮助 缓解 财务 压力 。 


要 充分 利用 分 层 存 储 ， 必 须 先 根据 数据 及 其 用 途 的 相关 标准 对 数据 进行 分 类 。 分 类 包括 

- 使 用 模式 ; 

+ 对 企业 的 重要 性 ; 

. 要 求 的 保护 等 级 ; 

. 恢复 的 需求 (本 地 和 灾难 ) ; 

- 性 能 要 求 。 

一 旦 完成 分 类 ， 数 据 的 部 署 应 该 以 最 具 成 本 效益 的 存储 介质 为 基础 。 这 样 的 方法 有 时 称 作 信息 生命 周期 管理 ， 即 ILM。 但 要 
使 这 种 做 法 有 效 ， 也 需要 解决 许多 问题 : 

. 需要 定义 一 个 有 用 的 分 类 方法 。 

. 需要 一 个 测量 数据 的 方法 ， 这 样 可 以 将 其 归 类 。 

- 所 有 可 用 的 存储 选项 应 符合 数据 分 类 。 

- 需要 创建 一 种 技术 ， 用 于 将 数据 转移 到 适当 的 存储 设备 。 


由 于 将 数据 分 配 到 特定 的 介质 是 一 项 持续 和 复杂 的 活动 ， 一 些 存 储 供应 商 提供 的 软件 ， 根 据 用 户 定义 的 策略 可 以 自动 管理 这 
一 过 程 。 


Teradata 推 广 的 一 种 分 类 方法 ， 称 为 多 温度 数据 。 [这 种 技术 部 署 四 种 分 类 : 热 、 温 、 凉 和 休眠 。 数 据 的 温度 定义 为 查 
询 、 更 新 和 数据 维护 的 访问 率 的 函数 。 换 句 话说 ， 热 一 些 的 数据 比 温 的 数据 的 访问 更 频繁 ， 而 温 的 数据 比 凉 的 数据 的 访问 更 频 
繁 。 最 后 ， 处 于 休眠 状态 的 数据 很 少 更 新 或 查询 ， 是 静态 数据 模型 的 一 部 分 。 


下 一 步 是 根据 数据 的 温度 对 使 用 的 存储 设备 进行 分 类 。 热 的 数据 是 MO 密集 型 的 ， 需 要 高 可 用 性 ， 可 以 将 其 放 在 提供 高 性 
能 、 高 可 靠 性 、 先 进 功能 和 大 容量 的 存储 设备 上 。 这 通常 意味 着 高 性 能 磁盘 驱动 器 ， 如 双 奇 偶 校 验 RAID 或 者 固态 存储 。 如 果 数 
据 没 有 存储 在 SSD， 它 应 该 缓存 ， 以 便 它 可 以 在 内 存 中 。 一 般 情 况 下 ， 热 的 数据 应 存储 在 最 快 、 需 要 频繁 访问 、 进 行 了 优化 的 存 
储 技术 中 。 


与 热 的 数据 相 比 ， 暖 的 数据 的 访问 较 少 ， 并 且 读 取 多 ， 修 改 少 。 这 样 的 数据 可 以 放 在 性 能 和 可 靠 性 较 好 ， 但 不 顶级 ， 且 比较 
便宜 的 磁盘 设备 上 。 暖 的 数据 的 存储 设备 比 热 的 数据 的 成 本 要 低 ， 但 相对 凉 的 数据 或 休眠 数据 ， 其 性 能 和 可 访问 性 要 好 一 些 。 
SATA 和 SCSI 配 置 的 存储 较 适 合 温 的 数据 。 


凉 的 数据 不 处 于 休眠 状态 ， 但 不 会 经 常 访问 。 这 些 数据 通常 仍 需要 驻 留 在 直接 访问 存储 设备 上 。 对 于 这 样 的 数据 考虑 使 用 成 
本 最 低 的 磁盘 设备 ， 如 NAS 或 基于 对 象 的 存储 。 


最 后 ， 处 于 休眠 状态 的 数据 ， 很 长 一 段 时 间 都 不 会 访问 (也 许 是 几 年 ) ， 其 数据 模型 很 稳定 ， 可 以 存储 在 脱 机 的 存储 系统 ， 
如 智能 磁带 或 光盘 。 


占有 关 这 一 话题 的 非常 有 趣 的 文章 ， 参 JUwww.teradatamagazine.com/v11n03/Tech2Tech/Why-Multi-Temperature-Data-Matters /. 


18.6 ”规划 未 来 


大 多 数 数 据 库 实现 都 不 是 静态 的 。 一 旦 部 署 ， 数 据 库 查 询 、 更 新 、 加 载 、 镍 载 、 重 组 和 数据 的 删除 和 插入 都 是 持续 进行 的 。 
当 组 成 数据 库 的 数据 发 生 改 变 时 ， 其 存储 需求 也 会 随 之 改变 。 


DBA 必 须 时 刻 保持 警惕 ， 为 未 来 的 发 展 规 划 。 


DBA 必 须 时 刻 保 持 警 惕 ， 为 未 来 的 发 展 规划 。DBA 必 须 留 意 数据 量 和 用 户 访问 数据 的 数量 。 一 旦 增加 ， 可 能 就 要 修改 数据 
库 的 存储 。 


容量 规划 


容量 规划 是 一 个 过 程 ， 对 整个 系统 的 容量 进行 测量 ， 与 要 求 进行 比较 。 这 种 比较 的 目的 是 调整 系统 可 利用 的 资源 。 要 成 功 进 
行 容量 规划 工作 ， 需 要 了 解 新 的 企业 倡议 ， 以 及 它们 可 能 如 何 影响 现 有 的 基础 设施 ， 即 硬件 (CPU、 和 存储 、 网 络 和 内 存 ) 和 软 
件 (应 用 程序 和 系统 ) 。 


容量 规划 根据 需求 对 系统 容量 进行 测量 和 比较 。 


通过 测量 现 有 的 容量 ， 衡 量 容量 的 增长 速度 ， 再 考虑 企业 和 IT 举措 的 预期 容量 要 求 ， 你 就 可 以 知道 现 有 的 基础 设施 是 否 可 以 
维持 预计 的 工作 量 。 如 果 预 计 增 长 速度 超过 计算 环境 的 能 力 ， 那 么 你 需要 对 修改 或 扩大 计算 基础 设施 的 成 本 进行 评 佑 。 


从 存储 的 角度 来 看 ， 这 只 涉及 增加 更 多 的 磁盘 设备 ， 并 将 其 分 配给 DBMS。 但 是 ， 为 了 支持 额外 的 数据 和 用 户 ， 也 可 能 会 涉 
及 额外 的 任务 ， 例 如 : 


“ 重新 设计 应 用 程序 ; 
重新 设计 数据 库 ; 
- 修改 DBMS 参 数 ; 


- 重新 配置 硬件 组 件 ; 


可 以 从 多 个 角度 看 待 存储 消费 。 每 个 角度 都 是 有 效 的 ， 并 且 都 可 以 对 存储 利用 率 和 增长 提供 不 同 的 看 法 。 从 全 系统 角度 来 
看 ,磁盘 空间 的 消耗 速度 达到 了 总 水 平 。 通 过 服务 器 确定 哪些 计算 机 消耗 磁盘 空间 的 速度 最 快 ， 也 可 以 查看 存储 容量 。 还 可 以 在 
文件 系统 级 别 监测 存储 的 消耗 ， 以 确定 哪些 文件 系统 消耗 磁盘 空间 的 速度 最 快 。 最 后 ， 作 为 一 名 DBA， 你 只 需 查 看 那些 与 DBBMS 


相关 的 文件 。 底 线 是 ， 你 可 以 回答 以 下 问题 : 
什么 时 候 需 要 更 多 的 存储 空间 ? 
需要 多 少 额 外 的 存储 空间 ? 
“ 什么 地 方 需要 额外 的 存储 空间 ? 


- 需要 做 什么 来 满足 DBMS 的 额外 存储 ? 


18.7 es 


数据 库 由 数据 和 文件 组 成 ， 为 了 使 用 方便 ， 必 须 将 它们 存储 在 可 重复 使 用 的 介质 上 。DBA 必 须 了 解数 据 库 对 象 和 文件 的 不 
同 存储 选项 ， 并 为 每 个 文件 选用 适当 的 设备 ， 来 满足 容量 、 性 能 和 预算 目标 。 


存储 是 一 个 不 断 发 展 的 领域 。 


存储 是 一 个 不 断 发 展 的 领域 ， 新 的 技术 和 产品 不 断 问世 。DBA 必 须 跟 上 这 一 技术 ， 来 满足 他 们 的 数据 库 的 存储 需求 ， 进 而 
满足 其 企业 的 信息 技术 和 数据 处 理 需 求 。 


18.8 ”回顾 


1. 为 什么 大 多 数 数据 库 文 件 都 存储 在 磁盘 设备 上 ， 而 不 是 其 他 存储 介质 上 ? 

2.SAN 和 NAS 之 间 的 区 别 是 什么 ? 

3. 请 说 出 建立 一 个 存储 系统 要 考虑 的 五 个 目标 。 

4. 你 的 企业 已 经 决定 购买 RAID 阵 列 来 支持 DBMS。 你 会 建议 它们 使 用 哪个 级 别 的 RAID， 为 什么 ? 
5. 应 采取 哪些 存储 管理 措施 ， 以 确保 事务 日 志文 件 的 可 用 性 和 速度 ? 

6. 请 说 出 使 用 RAID-4 数 据 库 文件 的 利 次 。 

7. 当 计算 一 个 表 的 记录 大 小 时 ， 应 如 何 计算 可 变 长 度 列 的 大 小 ? 

8. 为 什么 将 数据 文件 和 索引 文件 放置 在 单独 的 磁盘 设备 上 是 有 利 的 ? 

9. 与 SCSI 设 备 相 比 ，SAN 有 什么 优势 ? 


10. 计 算 表 所 需 的 存储 量 就 是 将 一 行 中 所 有 列 的 字 节 数 相 加 ， 然 后 乘 以 总 列 数 ， 这 种 说 法 正确 与 否 ? 
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第 19 章 ”数据 移动 与 分 布 


数据 的 位 置 不 是 一 成 不 变 的 。 数 据 一 旦 创建 ， 就 被 企业 到 处 移动 来 支持 许多 不 同 的 用 途 : 不 同 的 应 用 程序 、 不 同 的 地 域 、 不 
同 的 用 户 、 不 同 的 计算 环境 和 不 同 的 DBMS。 


数据 的 位 置 不 是 一 成 不 变 的 。 


一 般 任 何 数据 的 单个 副本 都 很 好 。 数 据 多 次 在 整个 企业 范围 复制 、 转 换 、 清 洗 、 重 复 复 制 和 存储 。 相 同 数据 的 不 同 副本 用 于 
支持 事务 的 处 理 和 分 析 、 测 试 、 质 量 保证 和 业务 系统 ;还 用 于 支持 日 常 的 操作 和 报告 、 数 据 仓库 、 数 据 集 市 、 数 据 挖掘 和 分 布 式 
数据 库 。 控 制 海量 数据 的 重担 就 落 在 DBA 的 肩 上 。 


DBA 使 用 多 种 技巧 和 技术 以 促进 数据 的 移动 和 分 布 。 本 章 将 讨论 一 些 主要 工具 ， 用 于 将 数据 从 一 个 位 置 移动 到 另 一 个 位 置 
并 且 在 多 个 位 置 对 数据 提供 支持 。 


19.1 RENGE 


DBA 将 数据 从 一 个 地 方 移动 到 另 一 个 地 方 最 简单 的 方法 之 一 是 使 用 DBMS 自 带 的 LOAD 和 UNLOAD 实 用 程序 。LOAD 实 用 程 


序 用 于 向 表 中 填充 新 数据 ; 而 UNLOAD 实 用 程序 用 于 读 取 表 中 的 数据 ， 并 将 它们 放 在 数据 文件 中 。 


同样 地 ， 我 们 应 该 注意 到 每 个 DBM 实际 调用 的 实用 程序 名 称 可 能 不 同 ， 但 各 个 产品 的 功能 都 是 相同 的 或 类 似 的 。 例 
如 ，Microsoft SQL Server 和 Sybase 提供 的 是 BCP 实 用 程序 ， 而 Oracle 提 供 的 是 SQL*Loader。 


19.1.1 _ LOAD 实用 程序 


LOAD 实 用 程序 用 于 执行 向 数据 库 表 中 批量 插入 数据 。 通 常 可 以 支持 : 
* 将 行 添加 到 表 中 ， 保 留 当前 的 数据 。 
或 使 用 新 数据 代 蔡 所 有 已 有 的 行 。 


当 加 载 数据 时 ，DBA 必 须 考 虑 多 种 因素 以 确保 成 功 。 该 LOAD 实 用 程序 如 果 失 效 是 否 可 以 重启 ?尽管 部 署 一 个 可 重新 启动 的 
加 载 过 程 要 花费 更 多 的 时 间 ， 以 后 的 支持 工作 却 变 得 更 容易 。 对 于 可 重新 启动 的 加 载 过 程 ，DBA 必 须 确保 任何 用 到 的 工作 文件 
都 可 分 配 ， 以 及 LOAD 实 用 程序 可 以 在 它 中 断 的 地 方 重 新 启动 。 如 果 LOAD 实 用 程序 不 能 重新 启动 并 且 出 现 中 断 加 载 过 程 的 错 
误 ，DBA 必 须 做 出 一 种 选择 : 


1. 删 除 已 经 加 载 的 数据 并 从 头 开始 重新 加 载 。 
2. 或 确定 已 经 加 载 的 数据 并 从 正在 加 载 的 输入 数据 文件 中 删除 它们 的 记录 。 
当然 ， 当 使 用 LOAD 向 已 有 的 数据 中 添加 新 行 时 ， 这 项 任务 更 有 难度 ， 因 为 第 一 个 选项 需要 进行 选择 性 的 删除 。 


DBA 另 外 需要 考虑 的 是 数据 加 载 到 数据 库 之 前 是 否 需 要 进行 预 分 类 。 如 果 要 加 载 的 表 是 集群 的 ， 可 能 由 集群 列 对 输入 数据 
进行 排序 ， 从 而 让 LOAD 实 用 程序 能 够 以 集群 的 顺序 处 理 输 入 数据 文件 更 有 意义 。 如 果 数 据 不 是 集群 的 顺序 ， 可 能 会 导致 加 载 过 
程 使 数据 变 得 非 集群 ， 这 取决 于 DBMS 和 LOAD 实 用 程序 。 


大 多 数 的 数据 库 LOAD 实 用 程序 不 会 导致 触发 器 触 友 ， 触 发 器 触发 可 以 导致 数据 完整 性 问题 。 如 果 数 据 库 和 应 用 程序 计算 数 
据 或 强制 约束 依赖 触发 器 ， 那 么 ， 对 数据 库 的 状态 而 言 ， 在 不 触发 触发 器 的 情况 下 加 载 数据 可 能 是 毁灭 性 的 。 如 果 数 据 需要 定期 
加 载 并 且 存 在 触发 器 ，DBA 和 应 用 程序 开发 人 员 将 需要 开发 能 够 模拟 触发 器 动作 的 程序 或 脚本 。 


其 他 数据 库 工具 也 可 以 引起 LOAD 实 用 程序 的 问题 。 如 果 正 在 加 载 的 数据 不 符合 唯一 性 约束 或 检查 约束 ， 那 么 LOAD 实 用 程 
序 将 怎么 做 ? 同样 地 ， 这 取决 于 DBMS 和 LOAD 实 用 程序 。 有 些 LOAD 实 用 程序 有 足够 的 灵活 性 ， 可 以 (或 不 可 以 ) 提供 强制 约 
束 的 选项 。 在 这 样 的 情况 下 ，DBA 必 须 决定 LOAD 实 用 程序 是 否 丢 弃 无 效 数据 ， 或 者 是 否 可 以 加 载 不 符合 约束 的 数据 (这 可 能 会 
导致 数据 完整 性 问题 ) 。 有 些 LOAD 实 用 程序 甚至 不 向 DBA 提 供 选 项 ， 它 们 要 么 加 载 所 有 数据 ， 要 人 么 自动 丢弃 不 符合 约束 的 数 
据 。 总 而 言 之 ， 有 灵活 性 比较 好 ， 即 使 会 导致 DBA 有 更 多 的 工作 。 


当 LOAD 实 用 程序 允许 强制 约束 时 ，DBA 应 该 充分 利 有 用。 否则， 你 不 得 不 在 数据 加 载 完成 后 对 数据 进行 更 正 ,或 者 接受 违背 
数据 完整 性 的 事实 。 但 是 ,数据 处 理 一 次 (加载) 比 处 理 两 次 (加载 一 次 ,更 正 一 次 ) 的 效率 更 高 。 


使 用 LOAD 实 用 程序 进行 强制 约束 。 


在 使 用 LOAD 前 ，DBA 必 须 确保 为 所 有 需要 运行 LOAD 实 用 程序 的 进程 和 用 户 开 通 适 当 的 权限 。 某 些 DBMS 提 供 了 可 以 授予 
的 具体 LOAD 的 权限 。 大 多 数 DBMS 人 允许 表 的 所 有 者 和 那些 授予 了 管理 员 级 别 权 限 的 人 也 可 以 进行 数据 加 载 。 


描述 输入 文件 


使 用 LOAD 实 用 程序 填充 表 需 要 一 个 包含 数据 的 输入 文件 。DBA 必 须 定义 LOAD 实 用 程序 输入 文件 的 布局 ， 使 其 能 够 将 原始 
数据 翻译 成 数据 库存 储 所 需 的 格式 。 这 通常 是 通过 指定 每 一 列 的 数据 类 型 、 数 据 在 文件 中 的 开始 位 置 和 结束 位 置 。 有 些 LOAD 实 
用 程序 还 提供 了 在 有 限 的 规范 下 就 可 以 加 载 的 具体 格式 ， 如 逗号 分 隔 的 文件 ， 或 者 使 用 UNLOAD 或 EXPORT 实 用 程序 创建 的 文 
件 。 


LOAD 实 用 程序 必须 能 够 处 理 空 值 。 空 值 通常 是 由 指示 器 字 节 和 检查 该 字 节 的 具体 语句 处 理 的 。 例 如 ，LOAD 实 用 程序 可 以 


旧 定 一 个 语句 ， 如 


LOAD . . . STATUS POSITION (20:25) CHAR(6) NULLIF(26)='N'.. . 


该 语句 表明 名 为 STATUS 的 列 要 从 输入 文件 加 载 数据 ， 从 第 20 个 字 节 开始 ， 一 直到 第 25 个 字 节 。 然 而 ， 如 果 第 26 个 字符 的 
值 等 于 N，STATUS 列 将 设 为 空 。 


加 载 的 表 中 包含 空 值 列 ， 可 以 降低 LOAD 实 用 程序 的 性 能 ， 因 为 需要 额外 的 处 理 检 查 数据 是 否 应 为 空 。 如 果 数 据 是 定期 加 载 
到 表 ， 尽 量 避 免 这 些 表 中 包含 空 值 列 。 


有 些 LOAD 实 用 程序 提供 了 额外 的 控制 ， 人 允许 DBA 修 改 加 载 过 程 的 功能 。 例 如 ， 控 制 默认 值 加 载 的 子 句 或 绕 开 某 些 加 载 记录 
的 子 句 。 一 定 要 了 解 使 用 的 LOAD 实 用 程序 的 所 有 参数 ， 以 便 你 可 以 对 数据 加 载 到 表 的 方式 进行 控制 。 有 时 ，LOAD 实 用 程序 可 
以 代 蔡 应 用 程序 来 进行 数据 插入 ， 这 可 以 减少 程序 的 工作 量 ， 因 为 编写 、 测 试 和 调试 程序 逻辑 都 不 需要 。 相 反 ，LOAD 实 用 程序 
的 逻辑 和 处 理 过 程 可 以 由 DBA 使 用 参数 和 实用 程序 的 子 句 进行 控制 。 


在 加 载 过 程 中 ， 尽 量 避免 转换 数据 的 类 型 。 尽 管 大 多 数 LOAD 实 用 程序 可 以 自动 转换 类 似 的 数据 类 型 ， 但 执行 这 样 的 转换 也 
需要 CPU 的 额外 工作 。 例 如 ，LOAD 实 用 程序 或 许 能 够 将 输入 文件 中 的 整 型 值 转换 成 数据 库 中 的 十 进 制 值 ， 但 如 果 LOAD 数 据 一 
开始 就 是 十 进 制 会 更 好 。 


当 表 必须 加 载 浮 点 数 时 ， 要 予以 特别 关注 。 通 常 LOAD 实 用 程序 将 需要 有 关 数 据 格式 的 具体 信息 。 

当 表 必须 加 载 浮 点 数 时 ， 要 予以 特别 关注 。 
高 效 加 载 

向 表 中 加 载 数 据 前 创建 所 有 需要 的 索引 ， 这 通常 是 个 不 错 的 想法 。 通 常 ，LOAD 实 用 程序 在 加 载 过 程 填充 索引 的 效率 要 比 为 
一 个 完整 填充 的 表 创 建新 索引 的 效率 更 高 。 当 然 ，DBA 应 核实 这 种 情况 对 DBMS 和 使 用 的 版 本 属实 。 [1 

向 表 中 加 载 数 据 前 创建 所 有 需要 的 索引 。 


如 果 LOAD 实 用 程序 能 够 执行 并 行 任务 ， 加 载 大 批量 数据 时 DBA 应 充分 利用 这 一 点 。LOAD 实 用 程序 或 许 能 够 接受 用 于 不 同 
片段 或 表 分 区 的 并 行 加 载 的 多 个 输入 文件 ， 或 者 它 或 许 能 够 建立 多 个 并 行 的 索引 ， 而 不 是 按 顺 序 逐 一 建立 。 像 这 样 的 并 行 操作 可 
能 会 使 加 载 数据 所 需 的 CPU 数量 增 减 ， 但 同时 ， 它 降低 了 LOAD 的 整体 运行 时 间 。 |! 

另 一 个 数据 加 载 性 能 相关 的 方面 是 ， 如 果 加 载 多 个 表 ， 你 需要 为 并 发 处 理 制订 计划 。 并 发 工作 量 的 明智 调度 可 以 使 一 些 
LOAD 实 用 程序 并 发 运行 。 例 如 ， 你 或 许 能 够 执行 来 自 不 同 数据 库 或 文件 组 的 表 的 并 发 负载 。DBA 应 尽 一 切 努 力 去 了 解 LOAD 实 
用 程序 的 能 力 和 局 限 性 ， 并 相应 制定 并 发 负载 工作 。 


如 果 LOAD 实 用 程序 提供 了 一 个 关闭 日 志 的 选项 ， 不 妨 考虑 使 用 它 来 加 速 加 载 的 过 程 并 尽量 减少 开销 。 然 而 ，DBA 必 须 在 加 


载 完 成 后 对 数据 进行 备份 以 确保 可 恢复 性 。 关 闭 了 日 志 , 没有 了 图 像 复 制备 份 ，DBMS 就 无 法 恢复 表 。 


通常 ，LOAD 实 用 程序 向 表 中 插入 初始 数据 的 效率 要 比 程序 或 多 个 SQL INSERT 语 句 执行 相同 的 任务 的 效率 更 高 。LOAD 实 
用 程序 为 相当 高 效 的 数据 批量 插入 进行 了 优化 。 除 了 LOAD 的 效率 ， 使 用 实用 程序 可 能 比 相 应 的 应 用 程序 出 错 更 少 。 


对 于 某 些 DBMS， 使 用 LOAD 代 蔡 批 量 删除 的 效率 会 更 高 。 当 发 出 没有 WHERE 子 句 的 SQL DELETE 语 名 时， 会 执行 批量 删 
除 。 使 用 具有 空 输入 文件 的 LOAD 实 用 程序 将 会 有 相同 的 结果 (所 有 的 行将 从 引用 表 中 删除 ) 。LOAD 可 能 更 有 效 ， 尤 其 是 在 加 
载 过 程 可 能 关闭 日 志 的 情况 下 。 


加 载 过 程 运行 其 他 实用 程序 


有 些 数据 库 LOAD 实 用 程序 充分 利用 了 这 个 事实 ， 即 数据 加 载 过 程 中 ， 它 们 有 权 访 问 所 有 的 数据 。 功 能 齐全 的 LOAD 实 用 程 
序 可 以 使 DBA 创 建 图像 副 本 备份 或 创建 加 载 过 程 中 的 数据 库 统计 信息 。 充 分 利用 这 种 功能 可 以 创造 效率 ， 因 为 数据 读 取 了 一 
次 , 但 处 理 了 多 次 (加 载 、 图 像 副 本 、 统 计 信息 等 ) 。 


此 外 ， 在 数据 加 载 之 后 ， 你 可 能 想 要 安排 REORG。 这 是 一 个 特别 好 的 主意 ， 如 果 加 载 的 数据 并 没有 预 排序 成 集群 序列 ， 并 
且 LOAD 实 用 程序 不 会 为 集群 进行 排序 。 


在 数据 加 载 之 后 ， 你 可 能 想 要 安排 REORG 。 


[1] 对 于 Sybase 和 Mictosoft SQL Servet 来 说 ， 在 索引 构建 之 前 加 载 数据 不 是 一 个 好 的 做 法 ， 因 为 集群 的 索引 会 直接 影响 表 中 行 的 物 
理 顺 序 。 
[2] 大 部 分 情况 下 ，CPU 的 增加 应 降 到 最 低 。 额 外 的 CPU 是 用 来 将 并 行 操作 的 结果 合并 为 单个 结果 的 。 


19.1.2 ”UNLOAD 实 用 程序 


数据 库 表 的 信息 经 常 需要 移动 或 复制 到 其 他 位 置 。 例 如 ， 你 可 能 相应 将 数据 转移 到 不 同 的 数据 库 ， 从 表 到 顺序 文件 便于 外 部 
处 理 ， 或 者 可 能 到 另 一 个 关系 数据 库 系统 或 平台 。 某 些 数 据 库 模 式 的 变更 需要 删除 并 重建 数据 库 对 象 (删除 对 象 的 同时 ， 删 除数 
据 ) 。 因 此 ， 在 对 数据 库 对 象 做 出 改变 之 前 ， 你 需要 将 数据 全 载 。 或 许 你 只 是 想 从 表 中 提取 行 的 一 个 子 集 作为 测试 数据 使 用 。 即 
使 重组 数据 库 对 象 通 常 也 需要 经 过 乞 载 数据 、 优 化 数据 ， 然 后 重新 加 载 数 据 。 


UNLOAD 实 用 程序 的 目的 是 从 数据 库 读 取 数据 ， 并 将 其 写 入 输出 数据 文件 。 没 有 UNLOAD 实 用 程序 ， 数 据 库 用 户 就 会 被 迫 
使 用 由 交互 SQL 设 施 、 报 告 生成 程序 或 应 用 程序 发 出 的 SQL SELECT 语句 来 卸载 数据 。 然 而 ， 这 些 方法 容易 出 错 ， 并 且 会 减 慢 大 
量 数 据 的 速度 。 此 外 ， 对 于 大 多 数 数据 库 的 需求 来 说 ， 需 要 开发 人 员 编写 应 用 程序 去 创建 文件 的 做 法 不 够 灵活 且 很 耗 时 。 因 此 ， 
许多 DBMS 都 提供 了 UNLOAD 实 用 程序 来 提供 高 速度 的 功能 ， 以 及 执行 原本 由 DBA 执 行 的 大 多 数 的 批量 数据 移动 任务 。 


UNLOAD 实 用 程序 的 目的 是 从 数据 库 读 取 数据 ， 并 将 其 写 入 输出 数据 文件 。 


在 使 用 UNLOAD 前 ，DBA 必 须 确保 为 所 有 需要 运行 UNLOAD 实 用 程序 的 进程 和 用 户 开通 适当 的 权限 。 通 常 ， 这 包括 授予 一 
定 级 别 的 权限 ， 其 中 包含 从 表 读 取 (SELECT) 数据 的 能 力 。 根 据 不 同 的 DBMS 和 实用 程序 ， 可 能 还 需要 额外 的 安全 。 


并 发 性 


正在 御 载 数据 的 表 可 以 执行 的 并 发 活动 的 级 别 取 决 于 UNLOAD 实 用 程序 的 参数 和 选项 。 之 所 以 执行 并 发 读 取 活动 是 因为 
UNLOAD 无 法 改变 任何 数据 。 大 多 数 UNLOAD 程 序 使 用 户 控 制 卸 载 数据 过 程 中 是 否 可 以 进行 并 发 数据 的 修改 。 通 常 ， 在 


UNLOAD 过 程 中 禁用 并 发 修改 是 合乎 情理 的 ， 因 为 这 可 以 确保 创建 文件 的 数据 一 致 性 。 


此 外 ， 在 数据 印 载 过程 中 ， 茶 止 运行 并 发 实用 程序 非常 有 用 或 者 很 有 必要 。 例 如 ， 在 UNLOAD 过 程 中 ， 加 载 、 重 组 或 恢复 
数据 将 会 导致 不 可 预见 的 后 果 ， 因 为 这 些 实用 程序 可 以 改变 数据 。 


从 图 像 副 本 备份 卸载 


现代 UNLOAD 实 用 程序 都 能 够 从 图 像 副本 备份 卸载 数据 。 这 种 能 力 是 很 有 用 的 ， 因 为 它 可 以 增强 并 发 数据 访问 。 从 图 像 副 
本 备份 卸载 可 能 是 有 益 的 ， 因 为 实时 数据 不 会 受到 影响 〈 即 实时 数据 没有 锁 ， 而 且 磁 盘 上 实际 表 中 没有 数据 读 取 ) 。 因 为 
UNLOAD 实 用 程序 从 图 像 副本 备份 读 取 数 据 ， 所 以 在 实时 数据 上 运行 的 应 用 程序 的 性 能 和 可 用 性 不 会 受到 并 发 卸载 操作 的 影 
响 。 


现代 UNLOAD 实 用 程序 提供 了 从 图 像 副本 备份 卸载 的 能 力 。 


当然 ， 被 卸载 的 数据 的 时 效 性 可 能 是 个 问题 。 如 果 完成 图 像 副 本 备份 ， 随 后 又 有 针对 表 进 行 的 更 新 、 插 入 和 删除 操作 ， 这 些 
修改 将 不 会 包括 在 御 载 的 数据 中 ， 因 为 它们 没有 针对 图 像 副 本 数据 集 (只 针对 实时 数据 本 身 ) 。 


如 果 你 想 购 买 一 款 UNLOAD 实 用 程序 ， 它 一 定 要 能 够 从 图 像 副本 备份 卸载 数据 。 


生成 LOAD 参 数 


常见 的 UNLOAD 实 用 程序 可 以 提供 一 个 选项 ， 即 用 于 生成 必要 的 控制 语句 ， 以 便 使 用 LOAD 实 用 程序 还 可 以 重新 加 载 正 在 
卸载 的 数据 。 这 样 的 选项 可 以 节省 时 间 ， 因 为 不 需要 DBA 手 动 创 建 LOAD 语 句 。 即 使 数据 会 加 载 到 其 他 表 中 ， 在 外 载 操作 过 程 中 
生成 LOAD 语 名 也 是 很 有 用 的 。 通 常 改变 生成 的 LOAD 语 句 比 从 头 开 始 编写 LOAD 语 句 要 容易 得 多 。 


数据 编码 方案 


UNLOAD 实 用 程序 应 该 允许 DBA 指 定 用 于 已 卸载 数据 的 编码 方案 。 几 种 常见 的 格式 选项 包括 EBCDIC、AsCll 和 Unicode。 
许多 DBMS 支 持 多 个 用 于 其 他 编码 方案 的 代码 集 。 根 据 DBMS 和 UNLOAD 实 用 程序 的 不 同 ， 你 或 许 能 够 指定 另外 的 数据 编码 方 
案 用 于 已 卸载 的 数据 。 

浮 点 数据 


与 LOAD 实 用 程序 一 样 ， 当 印 载 浮 点 数据 时 ， 必 须 予 以 特别 的 关注 。 当 印 载 浮 点 数据 时 ， 可 能 需要 指定 特殊 的 参数 ， 用 于 识 
别 已 印 载 的 浮 点 数 的 存储 格式 。 


限制 UNLOAD 数 据 


有 时 DBA 只 需要 和 印 载 数据 的 一 部 分 。 即 UNLOAD 输 出 文件 中 将 只 包含 表 的 一 部 分 行 。 众 多 的 原因 和 情况 表明 ， 只 外 载 整个 
行 的 一 部 分 可 能 很 有 意义 。 例 如 ， 用 于 创建 测试 数据 或 用 于 检查 某 些 行 。 


只 印 载 整个 行 的 一 部 分 可 能 很 有 意义 。 


大 多 数 UNLOAD 实 用 程序 都 提供 了 选项 ， 即 指定 有 限 数量 的 行 用 于 御 载 。 通 常 这 些 选 项 采取 三 种 形式 : LIMIT、SAMPLE 和 
WHEN. 


LIMIT 参 数 用 于 限制 由 UNLOAD 实 用 程序 卸载 的 行 的 数量 。 指 定 一 个 参数 ， 如 “LIMIT 200”， 将 会 导致 UNLOAD 实 用 程序 


在 卸载 200 行 之 后 停止 。 


SAMPLE 参 数 用 于 卸载 数据 的 样本 而 不 是 整个 表 。 通 常 这 个 参数 需要 一 个 十 进 制 条 件 ， 用 于 指定 取样 的 行 的 百分比 。 例 如 ， 
下 面 的 参数 表明 表 中 25.75% 的 行将 人 卸 载 : SAMPLE 25.75, 


最 后 ，WHEN 子 句 用 于 为 UNLOAD 实 用 程序 提供 SQL 谓词 ， 以 便 只 外 载 某 些 数据 。 例 如 ， 下 面 的 条 件 将 会 导致 SALARY 大 于 
50000 美 元 的 行将 卸载 : WHEN (SALARY>50000) 。 在 数据 写 入 御 载 文件 以 后 ，UNLOAD 实 用 程序 或 许 还 能 够 使 用 ORDER 
BY 子 句 对 这 些 数据 进行 排序 。 


当然 ， 这 三 个 选项 的 准确 语法 会 随 着 DBMS 和 实用 程序 的 不 同 而 有 所 不 同 ， 但 一 般 的 概念 是 相同 的 。 当 使 用 UNLOAD 实 用 
程序 创建 外 部 数据 文件 时 ， 每 个 选项 都 可 以 为 DBA 提 供 很 大 的 灵活 性 。 


UNLOAD 实 用 程序 的 准确 语法 随 着 DBMS 的 不 同 而 有 所 不 同 。 
从 视图 郑 载 


大 多 数 UNLOAD 实 用 程序 允许 从 视图 (不 只 是 表 ) 镍 载 数据 。 在 有 必要 从 多 个 表 访 问 数据 并 将 这 些 数据 放 到 一 个 文件 中 的 
时 候 ， 能 够 从 视图 卸载 数据 迟早 会 派 上 用 场 。 通 过 创建 一 个 视图 作为 这 些 表 的 连接 并 从 该 视图 卸载 数据 ， 你 可 以 将 从 多 个 表 卸 载 
的 数据 放 到 一 个 文件 中 。 


19.1.3 ”维护 应 用 程序 测试 台 


为 了 测试 应 用 程序 ，LOAD 和 UNLOAD 实 用 程序 可 用 来 维护 数据 测试 台 的 一 致 性 ， 如 图 19-1 所 示 。 当 创建 UNLOAD 数 据 文 
件 时 ， 便 可 以 在 每 次 程序 测试 前 加 载 这 个 文件 ， 就 此 开发 人 员 也 可 以 确定 每 次 程序 运行 所 针对 的 数据 是 相同 的 〈 这 对 跟踪 缺陷 和 
保证 程序 代码 的 正确 性 至 关 重 要 ) 。DBA 可 以 建立 适当 的 LOAD 和 UNLOAD 工 作 ， 然 后 交 给 应 用 程序 开发 团队 使 用 。 


“YS 


UNLOAD 
. is LOAD 
实用 程序 间 
B 实用 程序 


© | 测试 程序 


| 检查 输出 
和 数据 
a 


图 19-1 LOAD 和 UNLOAD 用 于 程序 测试 
UNLOAD 实 用 程序 非常 方便 ， 大 多 数 DBA 经 常会 用 到 。 使 用 UNLOAD 实 用 程序 可 以 解决 许多 状况 和 问题 。 


LOAD 和 UNLOAD 实 用 程序 可 用 来 维护 数据 测试 台 的 一 致 性 。 


19.2 导出 与 导 


与 UNLOAD 实 用 程序 类 似 ，EXPORT 实 用 程序 从 表 读 取 数 据 并 将 其 放 到 一 个 外 部 文件 中 。1MPORT 实 用 程序 读 取 由 EXPORT 
实用 程序 创建 的 外 部 文件 ， 并 将 读 取 的 数据 插入 一 个 表 中 。 


尽管 如 此 ， 通 常 IMPORT 和 EXPORT 不 只 与 数据 打交道 。 有 时 ，EXPORT 数 据 文件 还 包含 与 数据 相关 的 表 的 模式 。 在 这 种 情 
况 下 ，IMPORT 实 用 程序 仅 使 用 EXPORT 数 据 文 件 就 可 以 创建 表 并 向 其 中 导入 数据 。 有 时 ，EXPORT 文 件 不 只 包含 一 个 表 。 有 些 
EXPORT 使 DBA 可 以 指定 一 个 表 ， 然 后 按照 这 个 表 的 关联 提取 出 所 有 相关 的 文件 和 数据 。 


有 些 IMPORT/EXPORT 可 以 提供 类 似 UNLOAD 的 功能 ， 用 于 导出 (和 导入 ) 数据 的 取样 、 子 集 和 限制 。 然 而 ， 区 别 在 于 跨 
多 个 表 执 行 这 种 功能 和 维护 完好 无 损 的 数据 的 能 力 。 


并 不 是 每 一 个 DBMS 都 会 提供 IMPORT 和 EXPORT 实 用 程序 。 有 些 第 三 方 供 应 商 也 提供 导入 和 导出 产品 。 


并 不 是 每 一 个 DBMS 都 会 提供 IMPORT 和 EXPORT 实 用 程序 。 


19.3 ”批量 数据 移动 


UNLOAD 与 LOAD 组 合 是 DBA 移 动 大 批量 数据 最 常用 的 方法 。 但 是 ， 还 有 其 他 方法 用 于 移动 大 批量 的 数据 。 下 面 回顾 一 


19.3.1 ETL 软件 


ETL 是 一 种 执行 数据 移动 的 软件 。ETL 代 表 提 取 (extract) 、 转 换 (transform) 和 加 载 (load) 。ETL 软 件 主 要 用 于 使 用 其 
他 数据 库 和 数据 资源 填充 数据 仓库 和 数据 集 市 。 


ETL 代 表 提 取 (extract) 、 转 换 (transform) 和 加 载 (load) o 


尽管 大 多 数 DBM S 供 应 商都 提供 ETL 软 件 ， 一 般 该 软件 没有 基本 的 DBMS 许 可 证 。 另 一 方面 ，Microsoft SQL Server 包 括 用 
于 ETL 的 SQL Server Integration Services (SQL Server 的 集成 服务 ) ， 拥 有 标准 的 SQL Server 许 可 证 。 


通过 使 用 ETL 软 件 ，DBA 可 以 将 从 不 同 且 异 构 的 资源 中 提取 数据 的 过 程 自 动 化 。 例 如 ， 数 据 的 提取 可 能 来 自 大 型 机 的 遗留 
IMS 数 据 库 和 VSAM 文 件 ， 各 种 平台 的 关系 数据 库 如 Oracle、SQL Server 和 DB2， 人 存储 在 LAN 中 的 电子 表格 ， 以 及 外 部 数据 源 。 
可 以 对 ETL 软 件 进行 设置 ， 以 便 从 这 些许 多 不 同 的 源 中 识别 和 检索 数据 。 


一 旦 检索 后 的 数据 在 存储 到 目标 数据 库 之 前 ， 可 能 需要 以 某 种 方式 进行 转换 。ETL 软 件 使 这 些 变 更 的 自动 化 过 程 更 加 简单 。 
例如 ， 你 可 能 希望 将 编码 后 的 数据 转换 成 可 识别 的 值 ， 或许 从 1、2、3 变 为 已 婚 (Married) ”、 “单身 (Single) " #0 "S 
异 (Divorced) ”。 此 外 ，ETL 软 件 还 可 以 改变 数据 的 类 型 、 聚 合 与 总 结 数 据 。 


数据 转换 符合 你 的 规范 之 后 ， 它 会 加 载 到 目标 数据 库 。 ETL 软 件 可 用 于 复杂 的 数据 移动 需求 ， 它 比 简单 的 LOAD 和 UNLOAD 
实用 程序 更 加 灵活 ， 更 加 有 用 。 


19.3.2 ”复制 和 传播 


另外 一 种 移动 数据 的 方法 是 通过 复制 (Replication) 和 传播 。 当 复制 数据 时 ， 一 个 数据 仓储 复制 (copy) 成 一 个 或 多 个 数 
据 存储 ， 位 于 本 地 或 其 他 位 置 。 只 需 复制 (copy) 整个 表 到 多 个 位 置 就 可 以 实现 复制 。 或 者 ， 复 制 后 的 数据 可 以 成 为 该 行 或 /和 
列 的 一 个 子 集 。 复 制 可 以 设置 为 定时 自动 刷新 已 复制 的 数据 。 


另 一 方面 ， 传 播 只 是 变更 后 数据 的 迁移 。 可 以 通过 扫描 事务 日 志和 将 数据 修改 语句 的 结果 应 用 到 另外 的 数据 存储 来 实现 传 
播 。 数 据 仓库 最 初 的 传播 可 以 通过 复制 ， 以 及 由 随后 的 复制 (如 果 数 据 是 动态 的 ) 或 传播 引起 的 变更 的 传播 来 实现 。 


图 19-2 突 出 显示 了 复制 和 传播 之 间 的 区 别 。DBA 可 以 使 用 这 两 种 技术 来 移动 不 同 数据 库 和 数据 仓库 中 的 数据 。 第 20 章 提供 
了 在 数据 仓库 环境 中 管理 数据 库 的 详细 信息 。 
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图 19-2 复制 和 传播 


19.3.3 ”消息 软件 
消息 软件 (也 称 作 消息 队列 软件 或 应 用 程序 集成 ) 是 另 一 种 数据 移动 的 流行 形式 。 当 使 用 消息 队列 时 ， 数 据 由 一 个 应 用 程序 
或 进程 放置 到 队列 中 ， 从 队列 读 取 数据 则 是 由 另外 的 应 用 程序 或 进程 进行 的 。 


消息 软件 是 通过 提供 API 而 工作 的 ， 从 一 个 队列 读 取 或 向 一 个 队列 写 入 格式 化 的 消息 。 应 用 程序 可 以 从 该 软件 支持 的 任何 平 
台 的 队列 读 取消 息 ， 或 向 队列 写 入 消息 。 


消息 软件 为 移动 数据 提供 了 很 多 好 处 ， 但 主要 的 好 处 在 于 ， 从 桌面 到 大 型 机 的 不 同 平台 之 间 简 单 、 异 构 、 全 面 互通 的 连接 。 
消息 使 企业 能 够 很 容易 地 以 一 种 与 时 间 无 关 的 方式 集成 不 同 的 数据 岛 。 因 为 它们 都 使 用 消息 队列 ， 即 使 不 在 同一 时 间 运 行 的 两 个 
应 用 程序 也 可 以 互相 通信 。 


消息 使 企业 能 够 很 容易 地 集成 不 同 的 数据 岛 。 


流行 的 消息 软件 包括 : IBM 的 MQSeries、Microsoft 的 Service Broker 和 Oracle 的 Advanced Queuing 功 能 。 


19.3.4 ”其 他 方法 


当然 ， 还 存在 许多 其 他 数据 移动 的 方法 。 简 单 的 方法 如 使 用 表 编 辑 实用 程序 来 突出 显示 和 复制 数据 ;复杂 的 如 编写 程序 来 读 
取 数 据 库 和 写 入 外 部 文件 ， 或 者 直接 写 入 其 他 数据 库 中 。 


有 些 DBMS 还 提供 了 额外 的 内 置 方法 ， 用 于 复制 和 移动 数据 。 举 个 例子 ， 请 参阅 “Oracle 可 移动 表 空间 ”。 
Oracle 可 移动 表 空 间 
Oracle 提 供 了 从 一 个 数据 库 到 另 一 个 数据 库 移动 整个 表 空 间 的 能 力 ， 包 括 它 的 定义 和 内 容 。 在 某 些 情况 下 ， 移 动 表 空间 可 能 
比 从 一 个 数据 库 印 载 数 据 然 后 将 其 加 载 到 另 一 个 数据 库 更 加 容易 ， 也 更 高 效 。 
这 个 选项 需要 在 每 个 数据 库 中 都 定义 完全 相同 的 数据 库 对 象 。 此 外 ， 在 移动 表 空间 之 后 (当然 ， 之 后 可 以 编辑 数据 ) ， 数 据 
的 内 容 也 将 相同 。 


在 Oracle 系 统 中 ， 当 数据 必须 要 从 一 个 数据 库 移 动 到 另 一 个 数据 库 时 ， 可 移动 的 表 空 间 就 变 得 相当 有 用 。 通 常 ， 在 目标 数据 
库 复 制 文件 和 运行 IMP 命 令 ， 要 比 使 用 SQILXLoader 或 一 系列 导出 文件 来 实现 相同 的 事情 更 容易 。 此 外 ， 当 移动 表 空间 时 ， 源 数据 
库 和 目标 数据 库 都 不 需要 关闭 。 


19.4 “分 布 式 数据 库 


有 时 简单 地 将 数据 从 一 个 位 置 移动 到 另 一 个 位 置 是 不 够 的 。 相 反 ， 数 据 需要 人 存储 在 〈 以 可 访问 的 形式 ) 整个 企业 的 不 同位 
置 。 在 这 种 情况 下 ， 分 布 式 数据 库 是 必需 的 。 


分 布 式 数据 库 允 许 数据 驻 留 在 不 同 数据 库 的 不 同 物理 位 置 ， 可 能 是 在 不 同 的 操作 系统 上 使 用 了 不 同 的 DBMS 软 件 。 例 如 ,一 
家 企业 拥有 多 个 部 署 了 分 布 式 数据 库 系 统 的 零售 点 。 每 个 零售 点 有 一 个 数据 库 ， 总 部 则 容纳 中 央 数 据 库 。 使 用 网 络 技术 和 DBMS 
的 分 布 式 能 力 ， 随 时 随地 都 可 以 访问 和 修改 数据 。 此 外 ， 你 可 以 指定 哪些 位 置 有 更 新 ， 甚 至 读 取 、 访 问 某 些 数 据 库 的 权限 。 


分 布 式 数 据 库 允 许 数据 驻 留 在 不 同 数据 库 的 不 同 物理 位 置 。 


综 上 所 述 ， 网 络 环境 中 数据 的 位 置 确实 需要 对 快速 趣 取 时 间 、 高 集成 度 和 易 维护 性 的 诸多 设计 要 素 进行 分 析 。 分 布 式 数据 库 
技术 的 基本 前 提 是 提供 统一 的 数据 访问 ， 逻 辑 上 相关 但 物理 上 却 分 布 在 多 个 位 置 。 部 署 分 布 式 数据 库 的 方式 多 种 多 样 。 
数据 库 分 布 可 以 达到 的 度 是 由 在 用 的 DBMS 的 技术 和 能 力 定 义 的 。 分 布 式 环境 的 以 下 特性 受 DBMS 的 影响 : 
-自治 代表 分 布 式 数据 库 内 部 哪些 位 置 的 度 的 部 署 能 够 独立 
相反 ， 紧 耦合 代表 高 度 自 治 ， 因 为 分 布 环境 中 的 每 个 位 置 都 完全 
的 处 理 。 


运作 。 当 每 个 位 置 可 以 自愿 共享 其 数据 时 ， 中 级 自治 便 达 到 了 。 
了 解 系统 的 状态 ， 并 且 可 以 控制 在 多 个 位 置 跨越 数据 的 用 户 请 求 


.隔离 定义 了 每 个 位 置 是 否 知道 分 布 环境 中 的 其 他 位 置 ， 或 者 每 个 位 置 是 否 是 一 个 独立 的 服务 器 ， 不 知道 其 他 位 置 的 存在 。 
+ 透明 度 是 指 用 户 和 应 用 程序 的 数据 位 置 的 屏蔽 。 
分 布 式 环境 的 特性 受 DBMS 的 影响 。 


每 个 DBMS 都 提供 部 署 分 布 式 数据 的 功能 ， 这 些 数据 库 具 有 不 同 的 自治 度 、 隔 离 和 透明 度 。 要 建立 高 效 的 分 布 式 数据 库 环 
境 ，DBA 必 须 对 DBMS 的 能 力 有 非常 透彻 的 了 解 。 此 外 ，DBA 还 必须 指导 应 用 程序 开发 人 员 。 在 分 布 透明 性 的 系统 中 ， 开 发 人 
员 不 需要 知道 数据 的 位 置 。 更 典型 地 ， 从 数据 库 服务 器 访问 数据 之 前 ， 分 布 式 编程 需要 程序 员 明 确 编写 到 这 个 服务 器 的 连接 。 


一 个 分 布 式 数 据 库 可 以 设置 为 单个 数据 库 或 多 个 数据 库 。 通 过 单个 数据 库 的 设置 ， 单 个 DBMS 进 程 就 可 以 控制 所 有 的 数据 访 
问 。 另 一 方面 ， 多 数据 库 的 设置 提供 了 多 个 独立 的 DBMS 进 程 ， 每 一 个 都 控制 着 自己 本 地 数据 库 的 访问 。 


多 数据 库 设置 可 以 是 联合 的 ， 也 可 以 是 非 联合 的 。 联合 的 多 数据 库 设置 在 分 布 式 数据 库 之 间 传 播 控制 。DBA 可 以 控制 该 联 
合 的 每 个 本 地 的 数据 库 组 件 ， 以 确定 那里 存储 了 什么 数据 以 及 谁 可 以 访问 它 。 非 联合 的 多 数据 库 模式 集中 控制 这 些 问题 。 通 常 ， 
非 联合 的 多 数据 库 设 置 是 均匀 的 ， 而 联合 的 多 数据 库 设 置 是 不 均匀 的 。 


19.4.1 ”建立 分 布 式 环境 


分 布 式 DBMS 人 允许 数据 物理 上 位 于 多 个 位 置 的 多 个 DBMS 中 。 真 正 的 分 布 数 据 也 可 以 驻 留 在 客户 端 节点 的 数据 库 服务 器 上 。 
数据 越 分 布 ， 它 离 请 求 者 就 越 近 ， 性 能 也 就 越 好 。 然 而 ， 随 着 数据 分 布 的 位 置 增多 ， 管 理 就 变 得 更 困难 。 从 维护 的 角度 看 ， 大 量 
桌面 DBMS 的 管理 是 相当 困难 的 。 现 实 的 分 布 式 数 据 库 的 部 署 经 常 是 由 驻 留 在 多 个 服务 器 中 (有 时 ， 也 在 客户 端 节点 ) 的 数据 构 
成 的 。 


分 布 数据 也 可 以 驻 留 在 客户 端 节点 的 数据 库 服务 器 上 。 


从 DBA 的 角度 来 看 ， 部 署 分 布 式 数据 库 最 有 难度 的 几 个 方面 是 设计 和 设置 。DBA 的 首要 任务 是 要 了 解 DBMS 的 分 布 能 力 。 
是 否 能 够 参与 联合 或 非 联 合 系统 ? 需要 什么 额外 的 软件 支持 分 布 式 数据 库 ? 该 DBMS 是 否 支持 两 阶段 确认 ? 需要 什么 类 型 的 网 络 
协议 ? 


DBA 必 须 了 解 DBMS 的 分 布 能 力 。 


为 了 保证 公司 网 络 的 配置 可 以 支持 分 布 式 数据 库 ，DBA 需 要 和 网 络 管理 员 一 起 合作 。DBMS 需 要 对 配置 参数 进行 设置 ， 以 便 
可 以 开启 分 布 ， 并 可 以 概述 远程 数据 库 的 网 络 位 置 。 


到 目前 ， 已 经 讨论 完 所 有 的 物理 部 署 细 节 了 。 但 是 ， 分 布 式 数据 库 的 设计 方面 如 何 呢 ? 数据 的 走向 如 何 ? 为 什么 会 是 那样 的 
走向 ? 假设 你 正在 建立 如 图 19-3 所 描述 的 分 布 式 数据 库 。 


图 19-3 分布 式 数 据 库 部 署 的 示例 


在 示例 的 分 布 式 数据 库 中 ， 数 据 驻 留 在 Seattle、Washington， 以 及 Sydney，Australia。DBA 是 如 何 决定 哪些 数据 应 存储 
在 Seattle， 哪 些 数据 应 存储 在 Sydney 的 ? DBA 是 如 何 提供 适当 的 权限 和 配置 ， 以 便 用 户 可 以 访问 到 所 需 的 数据 ， 无 论 其 存储 的 


什么 地 方 的 ? 
数据 应 驻 留 在 便于 访问 的 服务 器 端 。 


坦率 地 说 ， 这 些 问 题 并 没有 明确 的 答案 。 但 是 ， 有 许多 规则 可 以 遵循 。 首 先 ， 数 据 应 驻 留 在 便于 访问 的 服务 器 端 。DBA 应 
对 数据 的 使 用 计划 进行 分 析 ， 以 便 可 以 通过 减少 数据 的 传输 成 本 来 优化 应 用 程序 的 性 能 。 例 如 ， 经 常 在 Seattle 访 问 的 数据 应 驻 
留 在 Seattle 的 数据 库 服 务 器 端 ， 而 经 常 在 Sydney 访 问 的 数据 应 驻 留 在 Sydney。 


然而 ， 决 定数 据 放 在 哪里 通常 不 那么 简单 。 在 许多 分 布 式 系统 中 ， 数 据 可 能 驻 留 在 2~ 3 个 地 方 ， 但 可 以 从 许多 地 方 访问 。 如 
果 某 个 数据 子 集 最 常用 在 Singapore 怎 么 办 ? 再 次 说 明 ， 将 数据 存储 在 最 近 的 数据 库 服 务 器 端 。 在 这 个 例子 中 ， 相 比 
Seattle，Sydney 距 离 Singapore 更 近 。 


如 果 两 个 地 方 的 数据 使 用 量 不 相 上 下 ， 又 会 出 现 额 外 的 担心 。 如 果 数 据 有 一 半 的 时 间 被 Sydney 使 用 ， 而 另 一 半 的 时 间 被 
Seattle 使 用 ， 又 该 怎么 办 呢 ? 在 这 种 情况 下 ，DBA 必 须 选择 一 个 地 方 ， 或 者 在 每 个 地 方 都 保留 副本 。 如 果 副 本 不 可 取 ， 一 定 要 
将 数据 存放 在 一 个 最 容易 管理 和 密切 监测 所 有 分 布 访问 性 能 的 地 方 。 


作为 DBA， 你 需要 向 应 用 程序 开发 团队 提供 分 布 式 数 据 库 的 使 用 指南 。 该 指南 应 涵盖 数据 位 于 什么 地 方 ， 访 问 分 布 式 数据 
对 性 能 的 影响 ， 以 及 如 何 优化 分 布 式 关 系 访问 。 其 中 一 些 指南 取决 于 DBMS 的 部 署 ， 而 其 他 则 独立 于 DBMS， 如 下 所 示 : 


` 只 检索 需要 的 数据 ， 尽 量 减少 网 络 流量 。 即 除了 应 用 程序 进程 绝对 需要 的 列 或 行 ， 不 请 求 其 他 的 列 和 行 。 
* 使 用 方法 ， 鼓 励 在 网 络 中 发 送 数据 块 而 不 是 一 次 一 行 。 


“ 如 果 可 能 ， 访 问 本 地 的 数据 而 不 是 远程 数据 。 


19.4.2 ”数据 分 布 的 标准 


有 两 种 常见 的 分 布 数据 标准 为 主要 的 DBMS 所 支持 : DRDA 和 RDA。 二 者 的 目标 是 相似 的 。 


分 布 关系 数据 库 架 构 (或 DRDA) 是 IBM 的 一 种 协议 ， 用 于 访问 分 布 式 数 据 ， 不 管 其 物理 位 置 如 何 。DRDA 提 供 了 可 以 协调 
分 布 位 置 之 间 沟 通 的 方法 。 这 就 允许 应 用 程序 可 以 远程 访问 多 个 位 于 不 同位 置 的 表 ， 并 将 它们 作为 一 个 逻辑 整体 呈现 给 终端 用 
户 。 如 果 DBMSs 与 DRDA 兼 容 ， 这 意味 着 DBM 可 以 遵循 DRDA 在 分 布 式 数据 库 方面 的 具体 要 求 。 


DRDA 是 IBM 的 一 种 协议 ， 用 于 访问 分 布 式 数据 ， 不 管 其 物理 位 置 如 何 。 


然而 ， 应 区 别 对 待 架 构 和 部 署 。DRDA 只 是 描述 了 分 布 式 数 据 的 架构 而 已 。 它 定义 了 访问 分 布 式 数 据 的 规则 ， 但 它 没有 提供 
执行 访问 的 实际 API。DRDA 不 是 真正 意义 上 的 程序 ， 它 只 是 一 组 标准 。 


远程 数据 库 访 问 (BERDA) 是 由 ISO 和 ANsI 标 准 委员 会 开发 的 一 组 相互 竞争 的 协议 。RDA 的 建立 ， 是 为 了 配合 可 用 于 大 多 
数 DBMS 的 SQL 的 一 个 子 集 。 


RDA 是 由 ISO 和 ANSI 标 准 委 员 会 开发 的 一 组 协议 。 


RDA 用 于 构建 客户 端 与 服务 器 端的 远程 连接 。 程 序 的 客户 端 接口 控制 着 向 数据 库 传输 数据 或 从 数据 库 接 收 数据 。RDA 的 目 
标 是 使 应 用 程序 与 异 构 数据 库 和 环境 实现 互联 。 


作为 DRDA 或 RDA 的 一 个 替代 ， 网 关 产 品 也 可 用 于 访问 分 布 式 数 据 。 网 关 至 少 由 两 个 组 件 组 成 (每 个 分 布 式 位 置 一 个 ) ， 组 


件 之 间 互 相通 信 从 而 允许 数据 的 访问 。 


19.4.3 ”访问 分 布 式 数据 

DBA 必 须 了 解 DBMS 所 支持 的 访问 类 型 ， 从 而 帮助 应 用 程序 开发 人 员 把 DBMS 的 能 力 与 应 用 程序 的 需求 一 一 对 应 起 来 。 可 能 
有 许多 不 同 的 访问 类 型 ， 但 并 非 都 是 DBMS 支 持 的 ， 而 异 构 部 署 也 存在 进一步 的 限制 。 

并 不 是 所 有 的 访问 方法 都 受到 每 一 个 DBMS 的 支持 。 


最 简单 的 分 布 式 数据 库 访问 类 型 是 远程 请 求 。 它 包括 对 单个 工作 单元 中 单个 位 置 的 单个 请 求 。 远 程 请 求 允 许 开 发 人 员 在 一 个 
DBMS 的 范围 内 进行 操作 的 同时 ， 参 考 另 一 个 不 同 的 DBMS。 这 是 编写 分 布 式 访问 的 最 容易 的 (但 最 不 灵活 的 ) 方法 。 


一 种 更 加 复杂 的 分 布 式 访问 的 类 型 叫做 远程 工作 单元 。 当 单个 应 用 程序 从 多 个 位 置 (但 不 位 于 同一 个 工作 单元 ) 访问 数据 
时 ， 它 会 发 生 。 程 序 员 必须 知道 数据 的 位 置 ， 并 根据 这 个 位 置 来 构建 访问 数据 的 工作 单元 。 在 这 个 场景 中 : 


每 个 请 求 必须 针对 一 个 位 置 。 
. 每 个 工作 单元 可 以 包含 多 个 SQL 语句 。 
- 每 个 工作 单元 必须 只 从 一 个 位 置 访问 数据 。 
因此 ， 每 个 工作 单元 的 多 个 SQL 请 求 是 允许 的 ， 但 每 个 SQL 请 求 只 是 一 个 DBMS。 


下 一 步 是 移 除 工作 单元 的 限制 ， 以 便 每 个 工作 单元 都 可 以 从 多 个 位 置 访问 数据 。 这 个 访问 类 型 称 作 分 布 式 工作 单元 。 在 这 种 
情况 下 ， 每 个 工作 单元 可 以 访问 不 止 一 个 DBMS。 多 个 SQL 语句 可 以 读 取 和 /或 修改 位 于 单个 工作 单元 内 的 多 个 数据 库 服务 器 的 


最 后 也 是 最 强大 的 分 布 式 访问 的 形式 是 分 布 式 请 求 ， 即 单个 SQL 语句 可 以 同时 从 多 个 位 置 访问 数据 。 因 此 ， 一 个 SQL 语句 可 
以 访问 多 个 数据 库 服务 器 ， 并 且 多 个 SQL 请 求 (分布 式 和 非 分 布 式 ) 都 可 以 包含 在 单个 工作 单元 内 。 这 是 最 灵活 的 分 布 式 数据 库 
访问 级 别 。 


其 他 产品 经 常 被 要 求 支 持 分 布 式 请 求 ， 如 IBM 的 DatajJoiner。 表 19-1 概 述 了 分 布 式 数据 访问 的 不 同类 型 ， 使 用 了 由 DRDA 协 
议 命名 的 名 称 。 


表 19-1 分 布 式 数据 库 支持 的 级 别 


远程 请 求 

远程 工作 单元 
分 布 式 工作 单元 
分 布 式 请 求 


19.4.4 两 阶段 COMMIT 


为 了 修改 跨 两 个 不 同 平台 的 分 布 式 数 据 ，DBMS 必 须 能 够 确保 修改 当 作 一 个 操作 。 和 任何 工作 单元 一 样 ， 所 有 在 COMMIT 
范围 内 的 SQL 语句 要 么 成 功 要 么 失败 。 因 此 ， 对 于 每 个 分 布 式 COMMIT， 要 么 将 所 有 操作 的 结果 应 用 到 每 个 数据 库 ， 要 么 都 不 
应 用 (不 管 数据 库 及 其 位 置 ) 。 这 需要 一 个 两 阶段 COMMIT， 一 个 是 准备 阶段 ， 另 一 个 是 COMMIT 阶 段 。 


DBMS 必 须 能 够 确保 修改 当 作 一 个 操作 。 


分 布 式 两 阶段 COMMIT 使 应 用 程序 可 以 更 新 位 于 一 个 工作 单元 内 的 多 个 数据 库 服务 器 上 的 数据 。 两 阶段 COMMIT 过 程 对 跨 
多 个 平台 的 COMMIT 起 到 了 协调 作用 。 它 提供 的 结果 持续 一 致 ， 从 而 确保 了 跨 平台 数据 的 完整 性 ， 无 论 通 信 或 系统 故障 。 其 中 
一 台数 据 库 服务 器 作为 两 阶段 COMMIT 的 协调 员 ， 而 其 他 数据 库 服务 器 则 作为 参与 者 。 


在 准备 阶段 ， 每 个 参与 者 都 为 COM MIT 做 准备 。 当 日 志 记 录 写 入 成 功 时 ， 每 个 参与 者 通知 协调 员 ， 表 示 它 已 经 准备 好 
COMMIT 变 更 。 当 所 有 参与 者 都 准备 COMMIT 时 ， 第 二 个 阶段 (真正 的 COMMIT) 开始 。 这 一 阶段 实现 为 协调 员 与 其 下 属 参 
与 者 之 间 的 一 系列 通信 。 在 COMMIT 阶 段 ， 成 功 是 假定 的 ， 即 使 在 系统 发 生 故 障 的 情况 下 。 因 为 所 有 参与 者 选择 继续 
COMMIT， 所 以 可 以 假定 成 功 不 会 违背 数据 的 完整 性 。 然 而 ， 如 果 有 任何 参与 者 COMMIT 失 败 ， 协 调 员 需 要 回 滚 所 有 参与 者 的 


变更 。 


无 论 何 时 应 用 程序 在 单个 工作 单元 执行 多 站 点 更 新 ， 都 必须 要 通过 一 个 两 阶段 COMMIT 确 保 数 据 的 完整 性 。 


19.4.5 分布 式 性 能 问题 

分 布 式 数据 库 环境 的 性 能 特别 令 人 担忧 。 与 任何 依赖 网 络 活动 的 系统 一 样 ， 性 能 最 大 的 威胁 来 自 网 络 流量 。 必 须 通过 网 络 发 
送 的 数据 越 多 ， 出 现 性 能 问题 的 可 能 性 就 越 大 。 

性 能 最 大 的 威胁 来 自 网 络 流量 。 


但 是 ， 稍 微 回顾 一 下 。 第 9 章 给 出 了 性 能 的 定义 : 数据 库 性 能 是 优化 资源 利用 ， 以 提高 吞吐 量 并 减少 争 用 ， 从 而 处 理 尽 可 能 
大 的 工作 量 。 分 布 式 环境 的 性 能 也 是 由 吞吐 量 和 响应 时 间 定 义 的 。 但 是 ， 请 求 者 和 服务 器 强调 了 这 个 定义 的 不 同方 面 。 


分 布 式 环境 的 性 能 也 是 由 吞吐 量 和 响应 时 间 定 义 的 。 


服务 器 对 性 能 的 看 法 主要 在 于 其 吞吐 量 。 请 记 住 ， 吞 吐 量 是 在 单位 时 间 内 可 以 完成 的 工作 量 。 服 务 器 必须 为 多 个 请 求 者 服 
务 。 可 服务 的 请 求 者 越 多 ， 服 务 器 的 性 能 就 越 好 。 然 而 ， 请 求 者 对 性 能 的 看 法 更 多 在 于 响应 时 间 。 响 应 时 间 是 完成 一 组 预定 义 的 
工作 所 需 的 时 间 量 。 对 于 终端 用 户 而 言 ， 响 应 时 间 这 个 指标 更 有 用 ， 因 为 他 们 在 等 待 结果 ， 响 应 时 间 越 长 ， 完 成 用 户 的 工作 所 需 
的 时 间 就 越 长 。 


为 了 分 析 分 布 式 数据 库 请 求 的 吞吐 量 ，DBA 必 须 检查 整个 所 需 的 吞吐 量 链 以 满足 请 求 。 错 过 分 析 任 何 一 个 组 件 的 性 能 都 可 
能 会 导致 性 能 的 下 降 。 请 求 的 吞吐 量 链 包括 每 个 硬件 和 软件 ， 以 及 每 个 必须 人 遍历 的 、 向 终端 用 户 提供 服务 的 配置 。 通 常 吞吐 量 链 
的 组 件 包括 : 


- 计算 机 硬件 、 本 地 操作 系统 、 网 络 软件 和 请 求 者 的 本 地 数据 库 。 
:网络 硬 件 、 配 线 、 网 关 、 路 由 器 和 集线器 。 
- 任何 中 间 件 或 请 求 者 (或 服务 器 ) 使 用 的 事务 处 理 系统 。 


* 计算 机 硬件 、 本 地 操作 系统 、 网 络 软件 和 服务 器 上 的 数据 库 。 


:磁盘 存储 和 存储 管理 软件 。 


该 链条 中 的 每 个 链接 都 需要 完成 一 个 既定 事务 。 任 何 给 定 的 配置 可 以 达到 的 最 佳 吞吐 量 都 受 限于 链条 中 最 慢 的 组 件 。 为 了 调 
整 分 布 式 性 能 ，DBA 应 在 吞吐 量 链 最 薄弱 的 环节 上 花费 更 多 的 努力 。 


19.5 ”小结 


因为 数据 在 整个 企业 的 不 同 地 方 都 是 必需 的 ，DBA 必 须 掌 握 移动 数据 的 各 种 方法 。 这 包括 将 数据 (数据 的 完整 副本 或 数据 
的 一 个 子 集 ) 从 一 个 地 方 复制 到 另 一 个 地 方 。 一 些 实用 程序 LOAD 和 UNLOAD、IMPORT 和 EXPORT， 是 完成 这 些 任务 的 理想 选 


择 o 


有 时 ， 数 据 库 环境 必须 进行 设计 ， 以 便 逻 辑 上 相关 的 数据 可 以 分 布 到 不 同 的 物理 位 置 。 这 就 是 分 布 式 数据 库 。 考 虑 到 对 
DBMS 能 力 的 了 解 、 企 业 的 需要 和 必须 要 支持 的 位 置 ，DBA 必 须 能 够 设计 分 布 式 数据 库 。 


数据 很 可 能 驻 留 在 企业 位 于 全 球 的 任何 一 个 分 部 。 作 为 一 名 DBA， 你 的 责任 就 是 确保 数据 的 完整 性 、 有 效 性 、 可 访问 性 、 
可 行 性 和 可 恢复 性 。 


数据 很 可 能 驻 留 在 企业 位 于 全 球 的 任何 一 个 分 部 。 


19.6 ”回顾 


1 .为 什么 说 在 单个 工作 单元 的 两 个 位 置 修改 数据 时 ， 两 阶段 COMMIT 很 有 必要 ? 
2. 请 详细 说 明 一 种 技术 ， 可 以 将 多 个 表 的 数据 和 卸载 到 一 个 UNLOAD 文 件 中 。 

3. 什 么 技术 可 用 来 限制 卸载 的 数据 量 ? 

4. 对 于 分 布 式 数 据 库 系 统 ， 有 效 效率 的 最 大 威胁 是 什么 ? 

5. 请 详细 描述 两 阶段 COMMIT 的 过 程 。 

6.LOAD 和 UNLOAD 是 如 何 维护 应 用 程序 数据 的 测试 台 的 ? 

7. 当 使 用 LOAD 实 用 程序 向 表 中 加 载 数据 时 ， 空 值 是 如 何 处 理 的 ? 

8. 请 说 出 三 种 用 于 描述 分 布 式 技术 和 分 布 式 数据 库 的 能 力 及 其 定义 。 

9 .复制 和 传播 之 间 的 区 别 是 什么 ? 


10. 当 完成 [LOAD 时 ， 什 么 样 的 问题 和 结构 可 能 会 导致 数据 完整 性 问题 ? 


附加 问题 


阅读 下 面 的 段落 并 摘 述 一 种 对 讨论 的 数据 有 意义 的 分 布 式 数据 库 部 署 。 在 你 概述 每 种 类 型 的 数据 存放 的 位 置 时 ， 一 定 要 牢记 
数据 放置 的 分 布 效率 的 概念 。 


Acme 公 司 的 总 部 位 于 Phoenix，AZ。 它 的 分 配 中 心 分 别 位 于 洛杉矶 、 纽 约 、 伦 敦 和 东京 。Acme 希 望 构建 一 个 分 布 式 数据 库 


用 于 跟踪 由 分 配 中 心 发 往 各 零售 点 的 商品 。 


除了 肉 类 、 和 鱼 和 家 禽 可 以 从 每 一 个 分 配 中 心 发 送 ， 其 他 所 有 食用 商品 都 由 洛杉矶 分 配 中 心 发 出 。 电 子 产品 只 从 纽约 发 出 。 发 
往 欧 洲 的 商品 都 从 伦敦 分 配 中 心 发 出 ， 亚 太 地 区 的 商品 从 东京 分 配 中 心 发 出 。 所 有 其 他 商品 可 以 从 任何 一 家 分 配 中 心 发 出 。 
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第 20 章 ”数据 仓库 管理 


不 断 追 求 更 多 更 好 的 商业 智能 已 经 促使 许多 企业 制定 数据 仓库 和 数据 集 市 来 为 它们 的 分 析 需 求 服务 。 尽 管 在 最 基本 的 层面 ， 
数据 仓库 仅 是 为 某 种 特定 的 处 理 类 型 而 设计 和 优化 的 数据 库 ， 但 DBA 对 它们 的 管理 应 与 一 般 的 数据 库 不 同 。 本 章 给 出 了 这 么 做 
的 原因 。 


数据 仓库 为 某 种 特定 的 处 理 类 型 而 设计 和 优化 。 


20.1 ”什么 是 数据 仓库 


那么 ， 什 么 是 数据 仓库 ?为 什么 DBA 对 待 它 的 方式 应 有 所 不 同 ” 称 作 数 据 仓 库 之 父 的 William H.Inmon 在 他 的 《Building 
the Data Warehouse》 一 书 中 是 这 样 定义 数据 仓库 的 : 


数据 仓库 : 一 种 面向 主题 的 、 集 成 的 、 非 易 失 性 的 、 随 时 间 变 化 的 数据 收集 ， 用 以 支持 管理 层 的 决策 。 
这 个 定义 究竟 是 什么 意思 呢 ? 下面 分 解 来 看 。 
. 面向 主题 的 。 数 据 涉及 某 个 特定 的 主题 ， 而 不 是 与 公司 的 持续 运营 有 关 的 各 种 主题 。 


* 集成 的 。 虽 然 数 据 仓 库 中 的 数据 来 自 不 同 的 源 ， 但 它们 却 合并 成 一 个 连贯 的 整体 。 


* 非 易 失 性 的 。 数 据 仓 库 中 的 数据 是 稳定 的 。 数 据 可 以 添加 ,但 不 可 以 删除 。 这 为 分 析 提 供 了 一 致 的 商业 图 景 。 
> 随时 间 变 化 的 。 利 用 特定 的 时 间 段 来 识别 存储 在 数据 仓库 中 的 数据 。 


对 于 我 们 的 目的 来 说， 数据 仓库 可 以 定义 为 这 样 一 个 过 程 : 提取 一 整合 一 转换 一 清理 数据 一 存储 在 整合 的 数据 库 。 数 据 仓 
库 包含 原子 数据 和 轻 度 总 结 的 数据 。 数 据 一 旦 合并 且 可 以 使 用 ， 数 据 仓库 就 成 为 管理 层 制定 访问 决策 的 唯一 数据 来 源 。 


数据 仓库 是 这 样 一 个 过 程 : 提取 一 整合 一 转换 一 清理 数据 一 存储 在 整合 的 数据 库 。 


那么 ,什么 是 数据 集 市 ? 数据 集 市 本 质 上 是 一 种 专门 为 某 个 商业 单位 或 区 域 定义 的 部 门 级 数据 仓库 。 实 际 上 ， 数 据 仓库 和 数 
据 集 市 之 间 没有 公认 的 区 别 。 数 据 集 市 不 一 定 比 企业 级 的 数据 仓库 小 。 它 可 能 比较 小 ， 但 是 其 大 小 根据 业务 的 需要 。 例 如 ， 业 务 
单位 级 别 的 部 门 分 析 可 能 比 跨 部 门 或 整个 企业 范围 的 分 析 需 要 更 多 的 历史 信息 。 


无 论 如 何 ， 从 DBA 的 角度 来 看 ， 对 待 数据 集 市 和 数据 仓库 的 方式 应 该 与 传统 的 数据 库 系统 有 所 不 同 。 


分 析 处 理 与 事务 处 理 


传统 的 数据 库 与 设计 成 数据 仓库 的 数据 库 之 间 的 主要 区 别 在 于 它们 支持 的 处 理 类 型 。 传 统 数据 库 的 设计 主要 针对 事务 处 理 ， 
即 支 持 进行 业务 运营 所 需 的 事务 。 事 务 定期 对 数据 进行 读 写 。 相 反 ， 数 据 仓库 的 设计 针对 分 析 处 理 ， 即 支持 企业 的 商业 智能 和 知 
识 发 现 需 求 。 分 析 操 作 以 读 操 作为 主 ， 写 操作 (如 果 有 ) 相对 较 少 。 


数据 仓库 为 分 析 处 理 而 设计 。 


常用 于 描述 分 析 处 理 的 术语 包括 : 决策 支持 、DSS、 商 业 智 能 、 高 级 分 析 、OLAP、 数 据 挖掘 和 信息 中 心 查询 。 每 一 个 都 以 
读 取 为 主 ， 包 括 筛选 数据 寻找 模式 和 趋势 的 各 种 查询 。 


DSS 代 表决 策 支持 系统 ， 是 针对 分 析 处 理 设计 的 只 读数 据 库 。 


OLAP 代 表 在 线 分 析 处 理 。 有 了 OLAP 技 术 ， 终 端 用 户 可 以 导航 数据 仓库 ， 通 过 针对 储存 的 数据 所 进行 的 互动 和 迭代 查询 ， 
从 数据 中 挖掘 出 智能 。 为 了 进一步 分 析 ，OLAP 使 用 细节 、 总 结 和 汇总 数据 的 多 维 视角 来 访问 信息 。 这 里 的 关键 术语 是 多 维 ， 一 
个 维度 由 终端 用 户 视 为 类 似 的 结构 属性 组 成 。 例 如 ， 年 、 季 度 、 月 、 天 等 构成 了 时 间 维 度 。 


OLAP 使 用 细节 、 总 结 和 汇总 数据 的 多 维 视角 。 


一 个 维度 是 分 析 的 基本 事实 的 修饰 符 。 事 实 的 例子 有 : 销售 额 、 库 存 总 数 和 消费 金额 。 每 个 事实 都 取决 于 多 个 维度 。 例 如 ， 
销售 额 因 地 理 区 域 、 时 间 、 产 品 等 而 有 所 不 同 。 通 过 跨 维度 运用 复杂 的 计算 ，OLAP 人 允许 事实 的 多 维度 分 析 。 此 外 ，OLAP 还 提 


供 多 种 其 他 功能 ， 包 括 : 分 析 和 发 展 趋势 、 数 据 子 集 、 通 过 不 同 层次 的 细节 向 下 钻 取 、 运 算数 据 “ 洞 穿 ” 和 数据 比较 方法 。 
与 OLTP 相 比 ，OLAP 的 底线 侧重 于 分 析 处 理 ， 而 不 是 事务 处 理 。 表 20-1 对 OLAP 与 OLTP 的 特性 进行 了 比较 。 


表 20-1 OILAP 与 OLTP 


a: OLTP 
[ 作 范 围 He AS AH JAE 单个 事务 
数据 量 组 行 
Bea it 
数据 的 易 失 性 低 ， 极 少 更 新 高 ， 经 常 更 新 
期 望 的 啊 应 时 间 分 钟 ， 有 时 或 许 小 时 次 秒 级 


机 需 使 用 动态 的 ， 不 可 预见 稳定 的 ， 可 以 预见 
处 理 优先 级 用 户 灵 活性 高 性 能 ， 高 可 用 性 
访问 类 型 未 定义 的 ， 动 态 的 预定 义 的 ， 静 态 的 


数据 挖 据 是 发 现 迄今 未 知 的 、 潜 伏 在 企业 数据 中 的 信息 和 模式 的 过 程 。 数 据 挖 扬 正 在 迅速 成 为 现代 、 有 竞争 力 的 公司 的 一 种 
需求 。 数 据 挖掘 过 程 是 将 局 发 式 算法 应 用 到 历史 数据 从 而 自动 发 现 数据 的 模式 。 可 用 数据 的 数量 和 质量 以 及 模式 发 现 算法 的 口径 
决定 了 数据 挖掘 应 用 程序 的 值 。 因 此 ， 部 署 数据 挖掘 的 企业 往往 可 以 将 更 多 的 数据 存 储 更 长 的 时 间 。 


OLAP 和 数据 挖掘 都 是 为 企业 数据 搜索 模式 的 方法 。 但 是 ，OLAP 受 用 户 驱动 ， 而 数据 挖掘 受 计算 机 驱动 。 这 里 有 关 OLAP 和 
数据 挖掘 的 介绍 过 于 简单 ， 其 实 每 个 主题 都 可 以 用 整 本 书 专门 介绍 。 从 DBA 的 角度 来 看 ， 关 键 是 要 做 好 规划 ， 使 数据 仓库 数据 
库 的 管理 方式 符合 其 用 法 。 


OLAP 和 数据 挖掘 都 是 为 企业 数据 搜索 模式 的 方法 。 


言 息 中 心 是 个 陈旧 的 术语 ，20 世 纪 80 年 代用 于 DSS 处 理 。80 年 代 信 息 中 心 扩散 的 读者 会 将 它 与 数据 仓库 联系 起 来 。 


20.2 ”管理 数据 仓库 


一 个 重要 的 问题 是 ， 管 理 数据 仓库 与 管理 这 些 传 统 的 数据 库 有 所 不 同 。 其 中 有 些 任 务 是 等 效 的 ， 但 部 署 与 期 望 并 不 相同 。 


对 数据 仓库 访问 最 多 的 是 分 析 处 理 的 读 取 操 作 ， 而 传统 的 数据 库 则 是 由 事务 处 理 的 读 写 操作 进行 访问 的 。 数 据 仓库 是 策略 ， 
它 使 用 户 发 现 隐藏 的 趋势 和 引导 业务 的 新 方法 。 而 传统 的 数据 库 是 战术 ， 它 使 业务 引导 日 常 操作 。 


在 承接 任何 部 署 项 目 之 前 ， 都 要 谨 记 数据 仓库 的 复杂 性 。 一 些 应 用 程序 可 以 访问 数据 仓库 的 源 数据 库 ， 它 们 的 详细 信息 必须 
是 可 用 的 。 还 要 分 配 开发 时 间 来 了 解 源 系统 的 复杂 性 。 此 外 ， 生 产 系统 相关 的 文档 往往 不 足 或 根本 不 存在 ， 因 此 仅 了 解 现 有 的 内 
容 就 很 浪费 时 间 。 分 析 源 数据 确定 数据 清理 的 级 别 也 是 一 项 耗费 时 间 的 工作 。 


所 有 这 些 问题 都 是 数据 仓库 管理 必须 考虑 的 因素 。 下 面 介绍 一 些 有 效 管理 数据 仓库 所 需 的 任务 。 


20.21 太志 十 于 人 不 


开发 数据 仓库 ， 蓝 图 中 一 定 要 包括 工具 、 人 和 方法 。 但 关注 点 往往 仅 停 留 在 技术 和 工具 上 。 数 据 仓库 项 目 需要 的 不 只 是 可 靠 
的 技术 ， 还 需要 严谨 的 规划 与 部 署 (方法 ) ， 通 过 监测 、 咨 询 、 培 训 、 讨 论 ， 以 及 用 户 组 从 其 他 人 那里 学 习 知 识 的 方式 。 


数据 仓库 项 目 需要 的 不 只 是 可 靠 的 技术 。 


20.2.2 ”数据 仓库 设计 


当 设计 数据 仓库 时 ， 一 定 要 创建 物理 设计 ， 考 虑 数据 仓库 的 特殊 需求 ， 而 不 是 仅 模 仿 类 似 生 产 OLTP 数 据 库 的 设计 。 其 
实 ，OLTP 数 据 库 常见 的 物理 设计 技术 (如 第 三 范式 数据 库 ) 可 以 抑制 OLAP 数 据 的 良好 运行 。 这 是 因为 数据 仓库 中 的 文件 和 表 
结构 、 索 引 以 及 集群 序列 的 数据 访问 需求 均 不 同 于 OLTP 数 据 库 ， 访 问 模式 也 是 这 样 。 


数据 仓库 常见 的 数据 库 设 计 是 星 型 模式 。 这 个 名 字源 于 数据 模型 绘制 时 所 形成 的 模式 ， 如 图 20-1 所 示 。 在 星 型 模式 设计 
中 ,位 于 中 心 的 事实 数据 表 存储 了 主要 的 业务 活动 。 该 事实 数据 表 通 常 是 基于 某 个 数值 或 一 组 数值 。 它 的 周围 是 影响 活动 的 各 个 
维度 ， 以 及 构成 星 型 各 个 点 的 维度 表 。 


市 场 顾客 
| 
| 
| 
| 税收 
| 
| 


电影 院 


图 20-1 星 型 模式 


在 这 个 简单 的 例子 中 ， 税 收 表 是 事实 数据 表 ， 星 型 的 五 个 维度 分 别 是 : 电影 、 电 影院 、 顾 客 、 市 场 和 时 间 表 。 作 为 一 名 终端 
用 户 ， 你 可 能 想 要 从 任何 一 个 维度 (或 者 一 个 维度 组 合 ) 查看 税收 。 


数据 仓库 常见 的 数据 库 设计 是 星 型 模式 。 

星 型 模式 非常 适合 数据 仓库 数据 库 的 设计 ， 原 因 如 下 : 

当 设 计 足 够 灵活 ， 以 使 数据 仓库 增长 或 应 用 程序 变更 时 ， 可 以 促进 其 快速 变更 或 补充 。 
. 设计 对 于 开发 人 员 和 终端 用 户 来 说 ， 很 容易 理解 。 

- 设计 模仿 了 终端 用 户 通常 认为 和 使 用 业务 数据 的 方式 。 


. 设计 容易 部 署 为 物理 数据 库 并 能 带 来 高 效 的 查询 ， 因 为 很 多 DBMS 的 构建 是 为 了 识别 并 优化 星 型 连接 。 


有 时 ， 需 要 更 多 的 细节 ， 因 此 星 型 模式 就 变 成 了 雪花 模式 。 雪 花 模式 是 一 种 维度 表 有 更 多 关联 的 星 型 模式 。 当 需要 更 多 涉及 
一 个 或 多 个 维度 表 的 表 时 ， 雪 花 模式 就 诞生 了 。 


为 了 支持 星 型 模式 ， 致 力 于 数据 仓库 部 署 的 DBA 应 该 关注 DBMS 安 装 的 优化 。 有 些 DBMS 产 品 需 要 特殊 的 安装 参数 ， 优 化 程 
序 才 可 以 更 高 效 地 对 星 型 模式 进行 查询 。 一 定 要 仔细 检查 安装 参数 ， 并 对 它们 进行 正确 的 设置 ， 否 则 一 些 查询 可 能 得 不 到 最 优 的 
处 理 。 


当然 ， 星 型 模式 设计 和 雪花 模式 设计 都 不 是 DBA 唯 一 需要 关注 的 。 为 了 帮助 提高 某 些 经 常 使 用 的 查询 的 性 能 ， 非 标准 化 数 
据 仓 库 的 某 些 部 分 也 是 常见 的 。 因 为 数据 仓库 是 一 种 只 读 的 数据 库 ，DBA 应 考虑 第 4 章 所 讨论 的 非 标准 化 选项 。 表 20-2 总 结 了 需 
要 考虑 的 各 种 非 标准 化 选项 。 


20-2 ” 非 标准 化 类 型 


非 标准 化 描 述 
预 连接 表 连接 的 费用 过 高 时 使 用 
报告 表 需要 专业 关键 报告 时 使 用 
镜像 表 表 被 多 种 环境 并 行 访问 时 使 用 
拆 分 表 不 同 的 组 使 用 表 的 不 同 部 分 时 使 用 
组 合 表 将 一 对 一 或 一 对 多 的 关联 合并 到 单个 表 时 使 用 
元 余数 据 用 来 减少 表 连 接 所 需 的 数量 
重复 组 用 来 减少 IO 和 (可 能 的 话 ) 存储 
衍生 数据 用 来 消除 公式 和 算法 
速度 表 用 来 使 层次 的 处 理 更 加 高 效 
物理 非 标 准 化 用 来 优化 专门 的 物理 DBMS 特性 


当 设 计数 据 仓库 时 ， 在 非 标准 化 的 地 方 设置 报警 很 有 好 处 。 一 般 情 况 下 ， 非 标准 化 加 速 数据 的 检索 ， 这 对 于 数据 仓库 可 能 是 
可 取 的 。 然 而 ， 一 定 要 慎重 对 待 数据 仓库 设计 的 非 标准 化 。 非 规范 化 不 是 强制 性 的 ， 因 为 非 规范 化 的 数据 对 数据 访问 进行 了 优 
化 ， 数 据 仓库 主要 是 “只 读 ”。 某 些 时 候 数 据 必 须要 填充 到 数据 仓库 中 ， 数 据 仓库 便 成 了 真正 意义 上 的 “多 读 ”， 而 不 是 只 读 。 
非 规范 化 的 数据 很 难 维护 ， 如 果 性 能 可 以 接受 ， 非 规范 化 应 尽量 避免 。 因 此 ， 与 传统 的 数据 库 部 署 一 样 ， 只 有 当 完 全 规范 化 的 设 
计 不 理想 时 才 进 行 非 规范 化 。 


一 定 要 慎重 对 待 数据 仓库 设计 的 非 标准 化 。 


数据 仓库 的 物理 设计 中 另 一 个 可 以 考虑 的 因素 是 数据 压缩 。 数 据 仓库 往往 很 庞大 ， 因 此 ， 可 以 使 用 压缩 来 减 小 对 存储 空间 的 
要 求 。 压 缩 对 性 能 的 影响 取决 于 DBMS 压 缩 数据 的 能 力 。 有 了 时， 压缩 对 性 能 有 帮助 ， 因 为 同样 大 小 的 空间 可 以 存储 的 行 更 多 ,而 
需要 的 MO 更 少 。 


最 后 ，DBA 应 该 为 数据 仓库 设计 物理 数据 库 以 便 鼓励 并 行 操作 。 由 于 OLAP 和 DSS 的 典型 分 析 查 询 必 须 处 理 大 量 的 数据 ， 性 
能 的 提升 通常 依靠 并 行 活动 。 可 以 考虑 使 用 分 区 表 空 间 来 充分 利用 DBMS 的 并 行 功能 ， 并 且 要 根据 数据 仓库 的 访问 模式 进行 分 
区 。 此 外 ， 将 索引 和 数据 表 空 间 放 在 不 同 的 磁盘 设备 上 有 助 于 并 行 任务 的 高 效 运作 。 


20.2.3 ”数据 移动 


在 数据 仓库 所 有 的 工作 当中 ， 最 重要 的 是 建立 数据 需求 ， 然 后 是 创建 捕获 并 将 数据 移动 到 数据 仓库 的 方法 。 如 果 没 有 清楚 


了 解 终端 用 户 的 需求 ，DBA 很 难 确定 要 移动 哪些 数据 ， 也 不 知道 要 如 何 移动 。 
建立 数据 需求 的 前 提 是 清楚 地 了 解 终端 用 户 的 需求 。 
要 建立 数据 需求 ，DBA 必 须 弄 清楚 两 个 重要 的 问题 : 
* 数据 仓库 的 目的 是 什么 ? 
对 数据 仓库 的 预期 是 什么 ? 


下 一 个 步骤 是 要 从 OLTP 系 统 和 数据 库 中 找 出 所 需 的 数据 。 数 据 仓库 团队 必须 了 解 每 一 块 数据 ， 包 括 数据 源 (数据 在 哪里 创 
建 ? 由 谁 创建 ?) 、 数 据 与 其 他 数据 元 素 的 关系 、 数 据 的 意义 以 及 将 其 纳入 数据 仓库 的 原因 。 所 有 这 些 元 数据 都 要 捕获 和 维护 ， 
以 便 在 数据 仓库 发 布 之 后 ， 还 可 以 容纳 OLTP 系 统 中 一 些 无 法 预知 的 数据 变更 。 


如 果 数 据 的 源 不 在 内 部 ， 你 可 能 需要 从 外 部 供应 商 那里 购买 数据 ， 并 将 其 集成 到 数据 仓库 中 。 


在 所 有 数据 以 及 所 需要 的 任何 转换 都 确定 之 后 ， 需 要 建立 数据 提取 和 数据 移动 的 过 程 。 通 常 ， 提 取 过 程 从 源 OLTP 数 据 库 中 
收集 数据 ， 并 将 其 放 在 一 个 中 间 的 临时 区 域 。 然 而 ， 这 些 原 始 数据 放 到 数据 仓库 之 前 ， 还 需要 进行 转换 。 


有 些 数 据 仓 库 的 设计 停留 在 只 读 模 式 ， 除 非 发 生 ETL 过 程 。 在 只 读 与 读 写 模式 之 间 切 换 是 通过 数据 库 命 令 或 设置 系统 参数 
(取决 于 正在 使 用 的 DBMS) 实现 的 。 


可 以 使 用 一 些 工具 ， 包 括 LOAD 和 UNLOAD 实 用 程序 、 导 入 和 导出 程序 、 传 播 软件 和 和 ETL 产品。 一 定 要 将 这 些 软件 的 成 本 考 
虑 到 数据 仓库 的 预算 中 ， 并 确保 所 有 需要 使 用 这 些 软件 的 DBA 都 接受 过 多 方面 的 培训 。 


一 致 的 数据 采集 


业务 反应 并 适应 行业 的 发 展 趋势 ， 将 导致 数据 的 变更 。 业 务 系统 中 的 数据 发 生 了 变更 ， 数 据 仓库 中 的 数据 也 必须 变更 。 随 着 
时 间 的 推移 ， 有 些 字段 会 淘汰 、 意 义 会 发 生 改变 、 大 小 和 类 型 也 会 改变 等 。 你 一 定 要 记录 物理 数据 的 变更 和 数据 语义 的 变更 。 不 
管 哪 种 类 型 的 变更 ， 你 都 需要 使 用 实用 程序 、 工 具 和 流程 来 特别 关注 这 些 问 题 并 及 时 作出 反应 。 


业务 系统 中 的 数据 发 生 了 变更 ， 数 据 仓库 中 的 数据 也 必须 变更 。 


20.24 ”数据 清理 


数据 仓库 中 数据 的 质量 对 数据 仓库 的 整体 效用 至 关 重 要 。 如 果 数 据 不 可 靠 ,或 者 不 能 被 用 户 所 理解 ， 数 据 仓库 就 可 能 会 
败 。 换 句 话 说 ,数据 仓库 中 的 数据 由 它 的 源 决定 。 如 果 没 有 清理 脏 数据 可 能 会 导致 数据 外 屋 (data outhouse) 的 创建 ， 而 不 是 
数据 仓库 。 因 此 ， 当 数据 从 其 他 源 移动 到 数据 仓库 时 ， 数 据 仓库 项 目 需 要 定义 并 执行 数据 清理 和 净化 任务 。 


当 移动 数据 到 数据 仓库 时 ， 数 据 净 化 可 以 用 来 “清理 ”数据 。 数 据 净化 的 一 个 组 件 是 将 代码 转换 成 对 用 户 有 意义 的 值 。 例 
如 ，5 的 CUSTOMER-CODE 对 于 普通 用 户 毫 无 意义 ， 而 “公司 ”或 “个 人 ”的 CUSTOMER-CODE 就 是 可 用 的 和 有 用 的 。 


一 些 潜在 的 数据 问题 可 以 降低 数据 仓库 的 实用 性 。 我 们 都 有 过 这 样 的 经 历 : 看 到 某 个 主要 文件 或 数据 库 的 内 容 ， 就 直观 地 知 
道 该 数据 是 错误 的 。 一 个 雇员 没有 办 法 出 生 在 1999 年 ， 而 接 下 来 的 一 条 记录 也 是 错误 的 。 她 如 何 做 到 在 1979 年 出 生 ， 而 在 1978 
年 入 职 呢 ? 


太 常见 了 ， 这 些 数据 完整 性 问题 都 被 轻描淡写 。“ 没 有 人 会 真正 重视 这 样 的 信息 ， 不 是 吗 ? ”好 吧 ， 也 许 人 不 会 ， 但 计算 机 
系统 会 。 错 误 的 信息 会 以 某 种 方式 进行 总 结 、 汇 总 或 操纵 ， 然 后 填充 到 另 一 个 数据 元 素 中 。 一 旦 错误 的 数据 移动 到 数据 仓库 并 进 
行 了 解析 处 理 ， 公 司 的 业务 可 能 就 会 受到 影响 。 如 果 对 仓库 中 的 数据 进行 分 析 ， 彻 底 检 查 雇员 经 历 又 会 怎么 样 呢 ? 如 果 有 足够 多 
的 雇员 和 出 生日 期 不 准确 ， 这 些 错 误 的 数据 可 能 会 对 就 业 决策 造成 影响 。 


不 要 掩盖 数据 的 完整 性 问题 。 记 录 下 来 并 让 它们 引起 你 的 上 级 和 使 用 该 数据 的 用 户 的 注意 。 通 常情 况 下 ， 使 用 数据 的 业务 单 
位 都 已 经 被 授权 修改 并 验证 它们 的 业务 数据 。 


不 要 掩盖 数据 的 完整 性 问题 。 


当 平 均 大 量 数据 时 ， 小 数据 的 差异 就 变 得 不 具备 统计 意义 了 。 然 而 ， 平 均 不 是 分 析 数 据 仓库 查询 所 采用 的 唯一 分 析 函 数 。 求 
和 、 中 位 数 、 最 大 值 、 最 小 值 以 及 其 他 聚合 和 标量 函数 怎么 样 呢 7 甚 全 ， 你 可 以 证 明 你 的 数据 问题 的 影响 和 你 认为 的 一 样 小 吗 ? 


答案 很 可 能 是 否定 的 。 


这 只 是 一 个 违反 数据 完整 性 的 小 例子 ， 许 多 应 用 系统 允许 进入 其 生产 数据 存储 。 有 些 违反 数据 完整 性 的 问题 似乎 是 不 可 原谅 
的 。 例 如 ， 我 们 大 多 数 人 都 遇 到 过 可 以 存储 任何 东西 (从 “*” 到 “! ”再 到 一 个 空白 ) 的 SEX 或 GENDER 列 (RFE) 。 我 们 
可 以 使 用 编程 的 方式 强制 将 这 些 字段 的 值 变 成 “M ”或 “F”， 但 这 似乎 又 太 简单 了 ， 因 为 根据 法 律 某 些 信息 (如 性 别 ) 具有 可 


真正 的 问题 是 ， 如 何 系统 地 记录 一 些 “ 未 知 ” 值 并 没有 部 署 。 如 果 在 输入 数据 时 没有 现成 的 数据 ， 每 一 个 可 以 修改 数据 的 程 
序 都 应 强制 记录 一 个 “未 知 ” 指 示 符 。 大 多 数 的 DBMS 产 品 都 允许 数据 列 存储 空 值 来 表示 “未 知 ” 或 “不 可 用 ”信息 。 之 前 的 关 
系 DBMS 产 品 和 数据 文件 并 没有 这 个 选项 。 然 而 ， 可 以 选择 一 些 特定 的 、 标 准 的 默认 值 。 有 个 小 窍门 就 是 将 默认 值 进行 标准 化 。 


“未 知 ” 值 的 标准 化 是 一 个 烦琐 的 过 程 。 我 们 的 原始 示例 就 使 用 了 一 个 数据 元 素 ， 域 有 两 个 有 效 值 。 大 多 数 数 据 元 素 的 域 都 
很 复杂 。 如 果 对 首位 允许 值 插入 的 应 用 系统 不 熟悉 ， 瓯 怕 很 难 确定 哪些 值 是 有 效 的 。 “1895-01-01” 对 于 那个 字段 是 否 有 效 ? 
或 者 它 是 否 是 “未 知 ” 值 的 默认 值 呢 ? 


pal 


“未 知 ” 值 的 标准 化 是 一 个 烦琐 的 过 程 。 


恐怕 只 有 对 程序 以 及 公司 知识 库 中 的 元 数据 进行 深入 分 析 才 能 回答 这 个 问题 吧 。 一 个 19 世 纪 的 日 期 可 能 是 有 效 的 出 生日 
期 、 股 票 的 发 行 日 期 、 账 户 成 立 日 期 、 出 版 日 期 或 其 他 任何 可 以 长 时 间 保 持 “ 新 鲜 ” 的 日 期 。 然 而 ， 只 是 因为 程序 允许 它 可 以 插 
入 ， 并 不 意味 着 它 就 是 一 个 有 效 的 日 期 。 一 个 用 户 输入 1895 而 不 是 1985， 是 很 简单 的 。 如 果 数 据 输 入 程序 在 捕捉 这 类 错误 方面 
不 够 智能 ， 你 的 系统 会 将 脏 数据 插入 生产 数据 存储 中 。 这 种 数据 完整 性 的 问题 最 难 发 现 。 很 可 能 只 有 对 数据 非常 熟悉 的 终端 用 户 
才 可 以 发 现 这 类 问题 。 


那么 ， 有 解决 方案 吗 ” 有 几 种 技术 可 以 使 用 ， 但 最 好 的 方法 是 努力 建立 一 个 将 数据 视 作 公司 资产 的 大 环境 。 那 么 问题 就 成 了 
要 引起 某 个 可 以 落实 重视 数据 政策 的 高 层 管理 人 员 的 重视 。 现 在 ， 我 们 的 讨论 范围 已 经 从 数据 仓库 跳 到 了 数据 管理 ， 接 下 来 还 是 
言 归 正 传 。 


对 于 填充 数据 仓库 的 数据 移动 ， 关 键 部 分 涉及 无 效 编码 数据 的 识别 ， 以 及 将 这 些 数 据 转 换 为 有 用 的 、 可 以 查询 的 信息 。 自 动 
化 的 ETL 软 件 可 以 帮忙 做 到 这 一 点 ， 但 它 不 能 帮 你 做 好 一 切 。 


将 数据 转换 为 有 用 的 、 可 以 查询 的 信息 。 


数据 质量 问题 


维护 数据 的 质量 是 大 家 持续 关注 的 问题 。 无 论 终端 用 户 还 是 数据 仓库 的 结构 与 维护 团队 都 有 责任 促进 并 提高 数据 的 质量 。 数 


据 仓 库 的 整个 开发 阶段 ， 乃 至 它 的 整个 使 用 生命 周期 ， 都 会 出 现 数据 问题 。 


一 定 要 制定 一 种 政策 ， 在 数据 广泛 应 用 于 数据 仓库 之 前 ， 报 告 和 纠正 数据 异常 。 此 外 ， 这 一 政策 的 制定 和 支持 一 定 要 让 终端 
用 户 参与 。 否 则 注定 会 失败 。 请 记 住 ,终端 用 户 比 企 业内 的 任何 人 ， 包 括 数据 仓库 的 开发 人 员 和 DBA， 都 更 了 解数 据 。 


制定 一 种 报告 和 纠正 数据 异常 的 政策 。 


不 要 低估 了 清理 脏 数 据 所 需 的 时 间 和 和 精力。 了解 这 个 问题 的 范围 以 及 纠正 这 些 问 题 所 需 的 过 程 。 将 企业 的 政策 和 可 用 的 自动 
化 工具 考虑 在 内 。 任 务 越 政治 化 ， 任 务 需要 的 时 间 就 越 长 。 可 用 的 工具 越 少 ， 任 务 需要 的 时 间 也 就 越 长 。 此 外 ， 如 果 你 对 拥有 的 
工具 不 其 了 解 ， 这 种 情况 可 能 比 干脆 没有 工具 更 糟糕 。 


操作 问题 


正如 前 面 的 讨论 所 表明 的 一 样 ， 你 会 在 喂养 数据 仓库 的 操作 系统 中 遇 到 问题 ， 可 能 是 运行 多 年 都 没有 发 现 的 问题 。 而 你 处 理 
这 些 问题 的 选项 却 很 少 : 


. 忽略 该 问题 ， 让 它 同 样 存在 于 数据 仓库 中 。 

- 在 操作 生产 系统 中 解决 问题 。 

. 如 果 可 能 ， 在 填充 数据 仓库 的 数据 转换 阶段 解决 问题 。 
可 能 会 发 现 以 前 未 发 现 的 操作 问题 。 


当然 ， 后 面 两 个 选项 更 受 青 睐 。 在 操作 系统 中 解决 问题 是 最 佳 解决 方案 ,但 是 你 需要 检查 数据 仓库 项 目 相关 的 预算 和 最 后 日 
期 ， 以 确定 是 否 可 以 在 项 目 过 程 中 弥补 生产 问题 。 如 果 不 可 以 ， 你 可 以 在 数据 流入 数据 仓库 之 后 ， 再 解决 这 些 数据 问题 。 如 果 可 
能 ， 你 还 应 计划 在 生产 系统 跟踪 错误 源 ， 以 便 一 旦 问题 确定 ， 还 可 以 将 它们 记录 下 来 。 


然而 ， 不 要 混淆 操作 需求 与 数据 仓库 的 项 目 计 划 。 当 数据 仓库 项 目 首次 局 动 时 ， 其 目标 可 能 混淆 了 操作 和 分 析 / 信 息 目标 。 
这 可 能 会 导致 灾难 。 重 新 定义 项 目 ， 仅 集中 在 非 操作 性 的 、 信 息 需求 。 数 据 仓 库存 在 的 主要 原因 在 于 将 操作 过 程 与 报告 分 离 。 


不 要 混 消 操 作 需 求 与 数据 仓库 的 项 目 计划 。 


20.2.5 ”数据 仓库 的 可 扩展 性 


随 着 越 来 越 多 的 企业 接受 数据 仓库 ， 人 们 对 其 所 能 提供 的 服务 的 要 求 也 越 来 越 多 。 新 的 报告 和 汇总 表 的 需求 增加 ， 数 据 仓 库 
可 能 激增 到 其 原始 大 小 的 好 几 倍 。 一 些 行业 调查 表明 60%~ 70% 的 数据 仓库 都 充斥 着 重复 或 见 余 数据 ， 如 汇总 表 和 索引 。 这 可 以 
增加 一 售 以 上 的 磁盘 存储 用 于 存储 数据 仓库 。 系 统 的 用 户 越 多 ， 同 步 查 询 越 多 ， 就 越 可 能 存在 响应 时 间 延 迟 。 因 此 ， 重 要 的 是 构 
建 系统 ， 使 其 能 够 与 用 户 的 需求 呈 线 性 比例 。DBA 可 以 选择 使 用 并 行 处 理 器 、 并 行 数据 库 、 位 图 化 索引 、 数 据 压缩 和 其 他 技术 
来 提供 更 好 的 可 扩展 性 。 


大 小 的 问题 


可 扩展 性 的 一 个 方面 是 大 小 。 很 多 初学 者 错误 地 认为 数据 仓库 一 定 很 大 。 尽 管 许多 数据 仓库 非常 大 并 且 可 以 容纳 海量 的 存储 
是 个 事实 ， 但 是 数据 仓库 也 可 以 很 小 并 且 仍然 可 以 为 企业 提供 值 。 事 实 是 ， 大 小 都 无 所 谓 。 


事实 是 ， 大 小 都 无 所 谓 。 


20.2.6 ”数据 仓库 的 性 能 


正如 第 9 章 讨论 的 一 样 ， 数 据 仓库 的 性 能 与 整体 数据 库 的 性 能 类 似 ， 只 是 强调 了 性 能 的 不 同方 面 。 一 般 情 况 下 ， 数 据 仓库 的 
性 能 可 以 从 以 下 四 个 方面 来 看 : 


* 提取 性 能 : 仓库 中 ， 数 据 的 更 新 和 完善 的 顺利 程度 如 何 。 

" 数据 管理 : 数据 仓库 设计 和 数据 库 维 护 的 质量 。 

* 查询 性 能 : 为 分 析 处 理 所 进行 的 数据 库 调整 如 何 。 每 个 查询 写 得 如 何 。 
* 服务 器 性 能 : 硬件 的 配置 和 性 能 。 


数据 仓库 使 用 从 生产 系统 提取 到 的 数据 进行 填充 (至少 一 部 分 ) 。 从 生产 系统 提取 数据 的 效率 可 以 对 数据 仓库 的 可 用 性 与 性 
能 产生 影响 。 收 集 数 据 并 将 其 加 载 到 数据 仓库 需要 的 时 间 越 长 ， 数 据 仓库 不 能 反映 当前 数据 的 周期 就 越 长 。 而 且 ， 缺 乏 流通 可 能 
会 对 任何 数据 分 析 的 实用 性 产生 影响 。 因 此 ， 优 化 数据 仓库 加 载 、 印 载 和 访问 的 速度 很 有 必要 。 在 数据 仓库 的 整个 生命 周期 ， 都 
可 以 使 用 高 速度 的 数据 库 实 用 程序 对 数据 流 进 行 优化 。 


数据 仓库 的 设计 是 其 固有 的 生存 能 力 。 数 据 仓库 的 设计 必须 便于 访问 和 分 析 。DBA 必 须 了 解数 据 是 如 何 访问 的 ， 并 对 数据 
库 结 构 进行 相应 的 设计 。 许 多 并 发 的 更 新 、 插 入 和 删除 可 以 在 任何 时 候 进 行 。 表 的 检索 方式 可 能 是 OLTP 系 统 数 据 库 设计 中 最 重 
要 的 元 素 。 相 反 ， 使 用 数据 仓库 的 OLAP 和 DSS 系 统 都 是 只 读 系统 ， 不 具备 (或 有 限 的 ) 在 线 修改 能 力 (数据 的 加 载 在 非 高 峰 期 
进行 ) 。 因 此 ， 数 据 仓库 可 能 需要 许多 精确 的 索引 用 于 日 常 的 分 析 查 询 ， 而 在 加 载 过 程 需要 的 索引 相对 较 少 (或 者 不 需要 ) 。 
DBA 必 须 非常 仔细 地 规划 ， 平 衡 查询 的 效率 和 加 载 过 程 的 效率 。 


数据 仓库 的 设计 必须 便于 访问 和 分 析 。 


数据 仓库 的 索引 没有 必要 与 操作 系统 的 索引 相同 ， 即 使 数据 仓库 只 是 该 操作 系统 的 真实 再 现 或 快照 。DBA 必 须根 据 数据 仓 
库 决 策 支 持 环境 的 访问 模式 和 查询 需求 ， 对 索引 进行 优化 。 此 外 ， 考 虑 在 数据 仓库 中 使 用 位 图 索引 来 优化 DSS 应 用 程序 的 性 能 。 


此 外 (从 数据 库 设 计 的 角度 来 看 ) ， 在 数据 仓库 操作 过 程 中 ， 不 需要 方法 来 确保 数据 的 完整 性 。 因 为 在 数据 转换 期 间 ， 已 经 
对 数据 进行 了 清理 和 净化 ， 那 些 用 来 部 署 数据 完整 性 的 机 制 ， 如 引用 完整 性 、 触 发 器 和 检查 约束 ， 用 在 数据 仓库 表 的 效率 不 高 。 
即使 不 进行 全 面 的 清理 ， 仓 库 中 的 数据 也 将 与 源 操作 系统 (应 使 用 RI 和 检查 约束 ) 中 的 数据 一 样 好 。 


永远 记 住 ， 数 据 仓库 是 一 种 决策 支持 工具 。 尽 管 数据 需要 定期 进行 更 新 和 总 结 ， 它 的 更 新 不 应 该 由 DSS 用 户 进 行 。 如 果 你 此 
设计 要 求 数据 仓库 中 所 有 的 数据 ， 像 生产 环境 一 样 可 以 直接 进行 修改 ， 那 么 需要 重新 考虑 你 的 数据 仓库 的 设计 。 


如 果 DBMS 人 允许 ， 考 虑 以 只 读 模式 启动 数据 仓库 数据 库 。 通 过 发 出 START 命 令 开启 只 读 模 式 ， 可 能 有 额外 的 收获 : 消除 只 读 
数据 库 的 锁 。 当 然 ， 当 刷新 数据 仓库 时 ， 数 据 库 必 须 以 只 读 模式 重启 。 


从 查询 性 能 的 角度 来 看 ， 数 据 仓库 环境 中 的 一 切 都 是 不 同 的 。 不 期 望 亚 秒 级 的 响应 时 间 ， 实 际 上 ， 如 果 查 询 的 结果 可 以 提供 
重要 的 分 析 见 解 ， 查 询 可 以 全 天 候 运行 。 这 并 不 意味 着 DBA 不 需要 监测 数据 仓库 的 查询 性 能 。 这 只 说 明 监 测 DSS 查询 的 目标 是 不 
同 的 。DBA 应 该 研究 的 是 发 展 趋势 ， 而 不 是 绝对 性 。 


数据 仓库 是 一 种 决策 支持 工具 。 


例如 ， 在 一 个 数据 仓库 中 ， 发 现 一 件 有 趣 的 事情 : 财务 部 在 下 午 3~4 点 运行 消费 数据 的 查询 ， 其 平均 响应 时 间 在 10~25 秒 。 
那么 ，DBA 可 以 根据 时 间 范 围 对 每 天 的 响应 时 间 进 行 研究 ， 以 确定 性 能 是 否 在 期 望 的 范围 之 内 。 如 果 查 询 响 应 时 间 突 然 且 一 直 
在 某 个 特定 的 时 间 范 围 跳 跃 ， 那 么 DBA 可 能 需要 帮助 终端 用 户 编写 更 多 有 效 的 查询 。 或 者 ，DBA 可 以 改变 数据 仓库 的 部 署 来 更 
好 地 支持 用 户 ， 如 建立 索引 ， 或 者 通过 聚合 或 摘要 转换 数据 。 


因为 数据 仓库 本 质 上 是 只 读 的 ， 你 应 该 能 够 使 用 脏 读 运行 DSS 和 OLAP 查 询 。 回 想 一 下 第 5 章 ， 需 要 通过 UNCOMMITTED 
READ 隔 离 级 别 来 实现 脏 读 。 有 了 这 个 隔离 级 别 ， 查 询 可 以 读 取 数据 库 中 永远 不 存在 的 数据 ， 因 为 数据 已 经 由 另 一 个 进程 改变 
了 ， 只 是 还 没有 提交 。 由 于 数据 仓库 的 只 读本 质 ， 这 个 问题 很 少 发 生 。 


数据 仓库 驻 留 的 服务 器 需要 夜以继日 的 性 能 峰值 ， 但 OLTP 和 OLAP/DSS 处 理 之 间 的 差异 降低 了 这 一 要 求 。 然 而 ， 服 务 器 硬 
件 和 配置 不 应 该 成 为 数据 仓库 性 能 的 瓶 贷 ， 因 此 必须 对 它们 进行 监测 和 调整 。 


企业 应 使 用 代理 性 能 监视 器 来 收集 、 分 析 和 存储 成 干 上 万 的 性 能 指标 ， 它 可 以 在 多 个 环境 中 进行 配置 ， 并 可 以 从 实时 和 历史 
角度 查看 所 有 的 关键 度量 。 以 这 种 方式 ， 企 业 可 以 部 署 集成 的 数据 库 性 能 解决 方案 ， 来 监测 和 管理 以 下 性 能 : 


. Windows、UNIX 和 大 型 机 环境 的 关系 数据 库 。 


:分布 式 环境 中 的 服务 器 。 


.分布 式 C/S 事 务 。 


自动 总 结 表 (又 称 作物 化 查询 表 ) 


大 多 数 专家 都 认为 通过 聚合 数据 仓库 中 的 记录 可 以 明显 提升 大 型 数据 仓库 应 用 程序 的 性 能 。 这 是 因为 很 难 理 解 大 多 数 数据 仓 
库 中 的 大 量 详细 信息 。 将 数据 总 结 成 逻辑 组 ， 使 它 的 同化 和 分 析 更 有 说 服 力 。 


影响 大 型 数据 仓库 性 能 的 最 具 戏 剧 性 的 方式 是 ， 提 供 正确 的 聚合 (44) 记录， 与 原 有 的 基本 记录 共存 。 站 


然而 ， 汇 总 数据 会 带 来 一 些 问题 。 首 先 ， 汇 总 数据 需要 大 量 的 处 理 ; 其 次 ,一 旦 汇总 ， 数 据 必须 存储 ， 这 会 占用 大 量 宝贵 的 
磁盘 空间 ; 更 麻烦 的 是 确定 哪些 数据 应 该 聚合 。 

许多 现代 的 DBMS 都 使 用 可 以 提供 自动 聚合 功能 的 自动 汇总 表 ， 也 称 作物 化 查询 表 或 物化 视图 。 其 基本 概念 是 通过 使 用 基本 
的 SQL 函数 ， 如 COUNT、SUM、AVG、MIN 或 MAX， 从 基 表 创建 一 个 新 的 聚合 表 。 其 结果 是 一 个 表 ， 该 表 在 更 高 级 别 的 维度 


聚合 。 


不 管 实际 DBMS 的 实施 如 何 ， 基 本 思路 是 DBA 控 制 着 汇总 表 的 创建 。 在 一 个 使 用 SQL 函数 的 查询 中 定义 汇总 表 。 用 户 甚至 不 
需要 知道 汇总 表 的 存在 。DBMS 的 优化 程序 可 以 确定 何 时 使 用 汇总 表 可 以 优化 针对 详细 数据 所 编写 的 查询 ， 然 后 使 用 该 汇总 表 自 
动 重 写 查询 。 此 外 ， 大 多 数 情 况 下 DBMS 自 动 维护 聚合 。 换 句 话 说 ， 当 相关 数据 变更 时 ，DBMS 自 动 会 更 新 汇总 表 中 的 数据 。 


DBA 控 制 着 汇总 表 的 创建 。 


在 一 般 情况 下 ， 自 动 汇总 表 可 以 显著 优化 数据 仓库 的 性 能 。 然 而 ，DBA 需 要 监测 哪些 聚合 使 用 的 频率 最 高 ， 以 确保 建立 适 
当 的 自动 汇总 表 。 此 外 ，DBA 需 要 计划 用 于 支持 聚合 数据 的 额外 磁盘 使 用 。 


[1] Ralph Kimball, «The Data Warehouse Toolkit》 (New York, #19964 John Wiley&Sons 出 版 )。 


20.2.7 ”数据 新 鲜 度 


因为 OLTP 系 统 中 的 数据 在 不 断 变化 ， 所 以 必须 设置 数据 仓库 过 程 保 持 数据 最 新 。 正 如 业务 用 户 分 析 仓 库 中 的 数据 一 样 ， 数 
据 的 新 鲜 度 是 个 问题 。 根 据 截 至 昨天 的 数据 发 出 的 分 析 查 询 的 结果 很 有 可 能 比 根据 一 个 月 前 的 数据 运行 同样 的 查询 的 结果 更 有 
用 。 


必须 设置 数据 仓库 过 程 保 持 数据 最 新 。 


数据 仓库 中 的 数据 与 生产 系统 中 的 数据 之 间 的 区 别称 作 数 据 延 迟 。 业 务 需求 会 驱动 所 需 的 延迟 数 。 有 些 数 据 仓库 需要 非常 新 
鲜 的 数据 ( 即 低 延 迟 ) ， 而 有 些 数 据 仓库 则 可 以 接受 高 延迟 。 


DBA 必 须要 为 业务 用 户 建立 一 种 可 以 用 来 确定 数据 新 鲜 度 的 方法 。 每 当 有 新 的 或 更 新 了 的 数据 加 载 到 数据 仓库 时 ， 业 务 用 
户 要 能 够 确定 这 些 数据 的 有 效 期 。 可 以 将 它 想象 为 一 使 印 了 日 期 的 牛奶 。 


但 是 ， 不 要 认为 只 有 完全 最 新 的 数据 仓库 才 有 用 。 研 究 数据 的 模式 和 趋势 时 ， 数 据 的 新 鲜 度 是 不 相干 的 (或 者 最 无 关 的 ) 。 
数据 新 鲜 度 的 重要 性 会 根据 数据 元 素 、 业 务 部 门 和 查询 的 不 同 而 有 所 不 同 。 


不 过 底线 是 ， 应 该 为 业务 用 户 提供 一 种 简单 的 方法 来 确定 数据 最 后 一 次 加 载 的 日 期 以 及 数据 的 新 鲜 度 如 何 。 


20.2.8 数据 内 容 


数据 仓库 管理 员 可 能 需要 提供 数据 仓库 内 容 的 元 数据 。 这 种 元 数据 可 以 包括 将 要 存储 的 数据 的 类 型 ， 哪 些 类 型 的 数据 变更 最 
频繁 ， 以 及 某 些 类 型 的 数据 的 增长 速度 如 何 。 跟 踪 增 长 模式 ， 有 助 于 确定 数据 仓库 在 存储 分 配 、 重 组 或 重新 设计 方面 可 能 需要 注 
的 领域 。 


cat 


t 


此 外 ， 可 能 无 论 你 如 何 严 格 地 管理 数据 仓库 的 填充 ， 无 效 或 不 恰当 的 数据 总 会 加 载 进 来 。 研 究 出 一 些 分 析 和 验证 数据 完整 性 
以 及 数据 仓库 天 系 的 方法 是 非常 有 价值 的 。 


研究 出 一 些 分 析 和 验证 数据 完整 性 以 及 数据 仓库 关系 的 方法 。 


数据 仓库 的 主要 价值 在 其 数据 内 容 。 因 此 ， 一 种 好 的 做 法 是 ，DBA 应 尽 可 能 地 了 解数 据 的 内 容 。 


20.2.9 ”数据 使 用 


与 传统 数据 库 管 理 不 相关 的 一 项 数据 仓库 管理 任务 是 识别 未 使 用 的 数据 。 当 特定 的 辣 值 或 条 件 都 满足 时 ， 继 续 维 护 仓库 中 的 
特定 数据 就 没有 意义 了 。 由 于 使 用 方面 的 原因 (业务 不 再 使 用 数据 ) 、 技 术 方 面 的 原因 (达到 能 力 极限 ) 、 监 管 方 面 的 原因 ( 规 
程 或 法 律 的 改变 ) 或 业务 方面 的 原因 (重组 数据 或 建立 不 同 的 过 程 ) ， 这 种 情况 都 可 能 发 生 。 


通常 ， 数 据 仓 库 是 非常 大 的 磁盘 存储 用 户 。 有 时 ， 设 计数 据 仓 库 太 过 ， 其 能 够 存储 的 数据 超过 了 真正 所 需 的 。 数 据 仓 库 
DBA 必 须 部 署 方法 来 检查 访问 了 哪些 数据 ， 频 率 如 何 。DBA 应 向 业务 用 户 确定 是 否 还 需要 这 些 处 于 非 活动 状态 的 数据 。 


如 果 大 量 未 使 用 的 数据 识别 ，DBA 可 以 决定 将 这 些 数 据 从 仓库 中 删除 。 当 然 ， 不 能 随便 采取 这 样 的 行动 。 只 有 在 验证 数据 


至 少 一 年 未 使 用 之 后 (考虑 季节 性 访问 变化 ) ， 才 可 以 对 这 些 数 据 采 取 行 动 。 


然后 ， 将 这 些 未 使 用 的 数据 从 数据 仓库 中 清除 ， 或 移 到 较 便宜 的 存储 媒介 (如 磁带 、 光 盘 或 CD) 。 清 除 的 数据 应 人 存储 一 段 
时 间 ， 保 证 没有 清除 错误 。 


清除 的 数据 应 存储 一 段 时 间 。 


跟踪 数据 仓库 活动 的 能 力 是 一 个 有 用 的 管理 目标 。 例 如 ，DBA 可 以 每 天 都 选择 使 用 概要 文件 ， 然 后 按照 天 、 周 或 月 进行 汇 
总 。 业 务 部 门 的 使 用 也 是 一 种 有 用 的 数据 。 跟 踪 数 据 的 离散 级 别 越 高 ( 列 级 别 最 低 ) 越 好 。 此 外 ， 这 一 信息 还 可 以 结合 性 能 监测 
的 统计 信息 来 估计 访问 的 响应 时 间 。 一 般 情况 下 ， 你 对 什么 人 以 及 什么 时 候 使 用 了 哪些 数据 了 解 得 越 清楚 ， 就 越 能 更 好 地 管理 数 
据 仓库 环境 。 


20.2.10 “财务 退 款 


在 大 多 数 企业 ， 数 据 仓库 项 目 受 多 个 部 门 的 管理 ， 其 中 每 个 部 门 都 有 各 自 的 财务 目标 。 数 据 仓库 DBA 应 确保 他 们 可 以 退回 
适当 的 费用 给 各 业务 部 门 和 用 户 ， 以 便 它们 可 以 满足 各 自 财务 报表 的 要 求 。 监 测 !T 成 本 需要 一 套 集成 的 解决 方案 ， 提 供 临 界 退 款 
服务 ， 跟 踪 在 企业 范围 所 使 用 的 信息 资源 。 


为 了 退 款 ， 你 应 该 考虑 权衡 和 跟踪 数据 仓库 的 每 一 个 请 求 ， 包 括 : 谁 请 求 数据 ， 请 求 返 回 了 多 少 行 ， 数 据 返 回 用 了 多 少 
CPU 周 期 ， 以 及 访问 了 哪些 表 。 根 据 特殊 的 企业 需要 ， 你 可 能 还 希望 跟踪 提出 请 求 的 某 些 特定 时 刻 。 有 些 企业 根据 某 些 特定 时 
刻 系统 的 活动 ， 选 择 收取 一 定 比率 的 费用 。 


即使 你 的 企业 不 选择 根据 实际 使 用 率 来 为 各 部 门 开 账单 ， 建 立 一 个 财务 退 款 系统 向 使 用 数据 最 多 的 业务 部 门 展示 数据 仓库 的 
值 也 是 很 有 意义 的 。 


权衡 和 跟踪 数据 仓库 的 每 一 个 请 求 。 


20.2.11 备份 与 恢复 


即使 数据 仓库 的 访问 是 只 读 的 ，DBA 也 必须 为 它 建立 一 个 备份 与 恢复 计划 。 有 些 初学 者 错误 地 认为 数据 仓库 的 备份 与 恢复 
不 是 问题 ， 但 实际 情况 不 是 这 样 的。 数据 一 直 都 在 流入 数据 仓库 ， 其 中 有 些 来 自 外 部 源 ， 可 能 不 那么 容易 复制 。 


此 外 ， 如 果 仓 库 中 的 数据 由 于 某 种 故障 而 丢失 ， 从 中 收集 来 的 生产 数据 的 形式 可 能 也 要 发 生变 化 。 或 许 ， 清 除 生产 数据 库 还 
可 以 为 更 多 的 事务 提供 空间 。 如 果 数 据 没有 存档 ， 它 就 不 能 复制 ， 即 使 进行 了 存档 ， 可 能 也 很 难 恢复 。 另 外 ， 数 据 仓库 中 的 数据 
通常 会 以 不 同 于 生产 数据 的 形式 人 存在。 数据 在 填充 到 数据 仓库 之 前 ， 可 能 已 经 经 过 了 清理 、 转 换 或 聚合 。 这 样 的 数据 可 能 很 难 或 
根本 不 可 能 重建 。 此 外 ， 数 据 仓库 往往 包含 外 部 数据 ， 如 果 丢 失 可 能 不 得 不 再 次 购买 ， 从 而 为 公司 带 来 不 必要 的 财务 消耗 。 


因此 ， 你 需要 为 传统 数据 库 提供 备份 与 恢复 计划 的 所 有 原因 ， 也 同样 适用 于 数据 仓库 数据 库 。 当 然 ， 只 有 当 向 数据 仓库 添加 
数据 时 ， 才 需要 进行 备份 。 


事实 上 ， 数 据 仓库 的 备份 与 恢复 需要 特别 的 考虑 。 数 据 仓 库 应 该 有 备份 与 恢复 策略 ， 这 使 企业 可 以 在 紧急 情况 下 恢复 所 有 基 
础 数据 。 数 据 仓库 正 变 得 与 面向 事务 的 数据 库 一样 重 要 。 


数据 仓库 的 备份 与 恢复 需要 特别 的 考虑 。 


根据 数据 仓库 的 规模 和 性 质 ， 你 可 能 决定 不 备份 数据 仓库 中 某 些 特定 的 数据 ， 因 为 刷新 数据 的 效率 更 高 。 然 而 ， 这 样 的 情况 
是 个 例外 。 检 查 每 个 数据 仓库 和 数据 集 市 的 成 本 /效益 ， 记 住 数据 更 新 或 刷新 的 频率 ， 以 及 多 久 实施 一 次 恢复 。 


最 后 ， 灾 难 恢复 需求 不 容 忽视 。 企 业 越 来 越 依赖 数据 仓库 所 提供 的 信息 ， 从 而 提高 数据 仓库 应 用 程序 的 重要 性 。 这 就 意味 
着 ， 必 须要 像 对 待 其 他 任何 灾难 恢复 规划 方面 的 关键 系统 一 样 对 待 数据 仓库 。 


20.2.12 不 要 凭空 操作 
DBA 需 要 了 解数 据 仓库 的 业务 需求 ， 并 确保 这 些 需求 得 到 满足 。 这 是 一 个 很 小 的 挑战 ， 因 为 根据 不 断 变 化 的 业务 系统 来 保 
持 数 据 仓 库 的 准确 性 和 可 用 性 更 具 挑 战 性 。 


随 着 业务 需求 的 变化 ， 业 务 系统 也 在 变化 。 当 业务 数据 库 和 文件 变化 时 ， 数 据 仓库 也 会 受到 影响 。 然 而 ， 当 涉及 数据 仓库 
时 ， 业 务 数据 库 和 数据 仓库 都 需要 进行 分 析 ， 因 为 任何 数据 格式 的 改变 都 可 能 对 它们 产生 影响 。 数 据 仓库 存储 着 历史 数据 ， 它 们 
的 格式 不 能 改变 。 在 对 业务 系统 做 任何 改变 之 前 ,数据 仓 库 团 队 必须 准备 接受 输入 数据 的 新 格式 ， 并 维护 被 改变 的 数据 元 素 的 多 
种 数据 格式 ， 或 者 部 署 一 种 转换 机 制作 为 数据 转换 过 程 的 一 部 分 。 


但 是 ， 要 知道 ， 这 种 转换 可 能 会 导致 数据 丢失 或 混乱 。 当 进行 转换 时 ， 明 智 的 做 法 是 彻底 地 计划 ， 并 使 用 经 过 测试 的 、 值 得 
信赖 的 工具 和 脚本 ， 尽 可 能 将 此 过 程 自动 化 。 单 纯 依靠 人 工 转 换 ， 很 可 能 会 导致 数据 错误 。 


转换 可 能 会 导致 数据 丢失 或 混乱 。 


20.3 JWA 


随 着 用 户 开始 分 析 数 据 和 业务 的 发 展 趋势 ， 数 据 仓库 可 以 为 企业 提供 竞争 优势 。 数 据 仓库 一 旦 部 署 就 不 能 回头 ， 因 为 用 户 会 
上 瘾 ， 企 业 将 更 加 有 利 可 图 ， 你 也 会 因为 对 企业 的 成 功 所 作出 的 贡献 而 感到 满足 。 


DBA 的 职责 是 管理 公司 的 数据 仓库 ， 因 此 需要 了 解数 据 仓库 与 生 俱 来 的 分 析 本 质 。 支 持 数 据 仓库 的 许多 任务 都 与 支持 传统 
的 、 专 注 于 OLTP 数 据 库 的 任务 很 相似 。 但 是 也 有 一 些 差异 ， 你 需要 将 它们 构建 到 你 的 数据 仓库 管理 策略 与 程序 中 。 


管理 数据 仓库 需要 结合 知识 丰富 的 人 、 有 特色 的 工具 和 强大 的 方法 。 只 有 将 这 些 不 同 的 资源 整合 到 一 起 ，DBA 才 能 保证 建 
了 立 有 效 的 数据 仓库 ， 并 对 其 进行 有 效 的 管理 。 


20.4 [alpen 


1 数据 仓库 与 数据 集 市 的 区 别 是 什么 ? 


2. 因 为 数据 仓库 是 只 读 环 境 ， 是 否 有 必要 为 它 开发 一 种 备份 与 恢复 计划 ? 


3. 请 描述 几 种 在 数据 加 载 到 数据 仓库 之 前 应 用 于 数据 的 数据 清理 技术 。 
4. 当 设计 数据 仓库 时 ， 在 业务 OLTP 系 统 发 现 的 问题 应 如 何 处 理 ? 

5. 请 描述 星 型 模式 ， 并 说 出 其 对 数据 仓库 数据 库 有 效 的 原因 。 

6 .数据 仓库 性 能 管理 的 四 个 方面 是 什么 ? 

7. 何 时 数据 可 能 需要 从 数据 仓库 清除 ? 

8.OLAP 与 数据 挖掘 之 间 的 区 别 是 什么 ? 

9. 讨 论 当 创建 数据 仓库 的 物理 设计 时 ， 必 须要 特别 考虑 的 各 种 选择 。 


10. 非 规范 化 始终 是 数据 仓库 数据 库 的 一 个 很 好 的 选择 ， 这 种 说 法 正确 与 否 ? 
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第 21 章 ”数据 库 连 接 


安装 DBMS 和 创建 数据 库 是 DBA 工 作 中 极其 重要 的 组 成 部 分 。 然 而 ， 如 果 DBM 9 没 有 连接 到 网 络 ， 就 没有 人 能 够 访问 数据 


211 多 层 、 分 布 式 计算 


本 节 提 供 了 多 层 、 分 布 式 计算 的 简短 介绍 ， 包 括 客户 端 /服务 器 。DBA 必 须 了 解 多 层 处 理 设置 中 的 常用 术语 ， 保 证 分 布 式 业 
务 环境 的 数据 库 访问 。 


21.1.1 回顾 历史 


在 计算 的 早期 ， 计 算 机 需要 大 量 的 电力 和 资源 才能 运行 。 批 处 理 是 唯一 的 操作 模式 ， 用 户 收 到 的 打印 报告 是 他 们 唯一 的 信息 
源 。 大 型 机 程序 员 通 过 打 孔 卡 与 计算 机 沟通 。 在 20 世 纪 70 年 代 随 着 技术 的 进步 ， 在 线 处 理 赋予 用 户 更 多 的 权力 ， 使 他 们 更 接近 
数据 的 可 用 性 。 在 20 世 纪 80 年 代 和 90 年 代 ， 个 人 计算 机 变 得 广泛 普及 并 且 价格 实惠 。 价 格 低廉 的 软件 更 是 加 速 了 个 人 计算 机 的 
增长 , 今天 它 已 经 是 一 个 具有 相当 能 力 和 内 存 容量 的 机 器 。 有 些 还 与 旧 的 大 型 机 一 样 强大 。 


最 初 ， 个 人 计算 机 用 作 单 机 设备 ， 具 有 自己 的 驻 留 数据 和 软件 。 用 户 可 以 分 享 数 据 的 唯一 方法 是 将 数据 复制 到 一 张 软盘 ， 并 
将 其 交 给 其 他 人 。 个 人 计算 机 也 可 以 用 来 模仿 大 型 机 终端 。 尽 管 终端 模仿 有 一 定 的 用 处 ， 但 它 并 没有 显著 增加 整体 的 生产 力 。 


最 初 个 人 计算 机 用 作 单 机 设备 。 


随 着 个 人 计算 机 的 进一步 普及 ， 终 端 用 户 变 得 更 加 精通 计算 机 。 这 开启 了 从 企业 系统 获得 更 多 数据 和 更 多 连接 的 无 尽 欲望 。 
位 于 许多 平台 的 企业 数据 库 的 无 颖 访问 成 为 一 种 需求 。 然 而 ， 为 了 提升 关键 任务 应 用 程序 的 生产 力 ， 一 些 计 算 资 产 如 大 型 机 、 中 
型 机 和 企业 人 员 必 须 进 行 整合 。 部 署 正 确 的 计算 资源 来 解决 那些 优化 的 生产 力 的 问题 。 如 果 终 端 用 户 不 得 不 花费 大 量 的 时 间 和 精 
力 ， 仅 是 为 了 访问 和 分 析 企业 数据 (不 管 其 驻 留 在 什么 地 方 ) ， 随 着 时 间 的 推移 ， 公 司 的 整体 的 竞争 力 会 受到 影响 。 


共享 信息 的 需要 使 用 相同 数据 、 打 印 机 和 软件 的 工作 组 网 络 取代 。 这 有 助 于 IT 部 门将 个 人 计算 机 包括 到 传统 的 系统 管理 任务 
中 ， 如 备份 和 技术 支持 。 随 着 用 户 对 个 人 计算 机 和 简单 的 用 户 界面 越 来 越 习 惯 ， 对 大 型 机 和 中 型 机 应 用 程序 的 期 望 也 随 之 增长 。 
使 用 图 标 、 下 拉 菜 单 和 多 种 颜色 成 为 新 的 应 用 程序 要 求 ， 这 可 以 在 高 性 能 的 个 人 计算 机 上 轻松 实现 ， 但 在 企业 大 型 机 应 用 程序 中 
并 不 普遍 。 


企业 已 经 采用 并 跨 多 个 计算 平台 集成 技术 。 现 在 分 布 式 、 多 层 处 理 司空 见 惯 ， 网 络 让 这 些 不 同 的 平台 连接 在 一 起 。 只 是 ，IT 
需要 管理 一 个 更 加 复杂 的 环境 ， 为 业务 提供 计算 服务 。 


分 布 式 、 多 层 处 理 司空 见 惯 。 


随 着 万 维 网 的 出 现 ， 用 户 通过 网 页 浏览 器 与 计算 机 的 交互 变 得 更 加 方便 。 今天， 网 页 浏览 器 是 访问 应 用 程序 的 最 流行 的 客户 


2u 
Uo 


21.1.2 ”业务 问题 


业务 的 三 股 势力 驱使 着 多 层 环境 的 变化 : 缩小 规模 、 扩 大 规模 和 规模 优化 。 顾 名 思 义 ， 缩 小 规模 是 一 个 向 下 的 变迁 ， 从 大 型 
机 到 联网 的 个 人 计算 机 工作 站 。 扩 散 的 功能 更 强大 ， 更 便宜 的 个 人 计算 机 已 经 使 得 缩小 规模 成 为 许多 大 型 机 商家 的 一 个 很 有 吸引 
力 的 选择 。 扩 大 规模 是 从 单机 个 人 计算 机 到 一 个 网 络 ， 该 网 络 将 许多 个 人 计算 机 连接 在 一 起 并 提供 对 企业 数据 库 的 访问 。 最 
后 ， 规 模 优化 是 将 应 用 程序 放 在 最 适合 其 需求 的 平台 的 做 法 。 例 如 ， 需 要 高 可 用 性 和 可 扩展 性 的 应 用 程序 可 能 需要 一 台大 型 机 ， 
至 少 对 于 一 些 应 用 程序 是 这 样 的 。 相 反 ， 需 要 快速 交付 和 高 度 定制 接口 的 应 用 程序 很 可 能 需要 一 台 运 行 某 种 Windows 版 本 (A 
为 它 的 某 些 组 件 ) 的 个 人 计算 机 工作 站 。 


21.1.3 “C/S 计 算 简 介 


C/S 可 以 定义 为 两 个 或 更 多 计算 机 计算 实体 之 间 的 一 种 关系 。 


客户 端 /服务 器 (C/S) 计算 使 个 人 计算 机 用 户 可 以 运行 标准 的 业务 应 用 程序 ， 并 且 可 以 通过 网 络 连接 访问 企业 的 共享 次 
源 。 基 本 上 ，C/S 可 以 定义 为 两 个 或 更 多 计算 实体 之 间 的 一 种 关系 ， 这 些 实体 共同 作用 来 完成 一 项 任务 。 其 中 每 个 实体 都 执行 涉 
及 的 一 部 分 工作 。 一 个 实体 (客户 端 ) 请 求 服务 ， 另 一 个 实体 (服务 器 ) 实现 该 请 求 。 当 然 ， 一 个 C/S 环 境 可 以 使 用 多 个 服务 
器 ， 每 一 个 都 实现 不 同 种 类 的 请 求 : 数据 库 访 问 、 应 用 程序 处 理 、 文 件 访问 和 打印 等 。 

当今 社会 ，C/S 计 算 无 处 不 在 


在 20 世 纪 90 年 代 ， 虽 然 术语 C/S 并 不 常见 ，C/S 计 算 仍然 成 为 大 多 数 现代 应 用 程序 得 以 运行 的 基础 设施 。 


各 种 互相 连接 的 服务 器 使 一 些 常见 的 计算 机 资源 可 以 在 一 个 C/S 实 施 中 共享 。 大 多 数 基于 个 人 计算 机 的 商业 软件 应 用 程序 可 
以 访问 联网 的 文件 和 打印 机 ， 就 好 像 它 们 与 桌面 个 人 计算 机 直接 连接 一 样 。 例 如 ， 在 联网 的 环境 中 ， 终 端 用 户 将 看 到 一 个 由 磁盘 
驱动 、 打 印 机 和 其 他 资源 组 成 的 公用 资源 池 ， 而 不 必 区 分 本 地 和 远程 资源 。 最 常用 的 服务 器 类 型 包括 打印 服务 器 、 文 件 服务 器 、 
数据 库 服务 器 和 应 用 程序 服务 器 。 


打印 服务 器 将 多 台 打 印 机 作为 一 种 共享 资源 供 网 络 用 户 访问 。 而 不 必 使 每 台 打 印 机 连接 到 每 一 台 桌 面 个 人 计算 机 ， 打 印 服务 
器 为 网 络 上 任何 连接 打印 机 的 个 人 计算 机 提供 方便 的 访问 。 


文件 服务 器 提供 了 一 种 网 络 用 户 间 共享 数据 文件 的 方法 。 文 件 服务 器 的 目的 不 是 执行 计算 任务 ， 也 不 代替 客户 端 运行 程序 。 
其 目的 主要 是 数据 的 存储 和 检索 。 


数据 库 服务 器 通过 启用 有 针对 性 的 数据 访问 ， 推 进 C/s 系 统 的 数据 共享 能 力 。 不 像 基于 局 域 网 的 文件 服务 器 (需要 检索 整个 


文件 ) ， 数 据 库 服务 器 能 够 接受 SQL 查询 并 响应 所 请 求 的 数据 。 
应 用 程序 服务 器 为 业务 应 用 程序 提供 服务 。 应 用 程序 服务 器 的 一 大 优势 在 于 其 能 够 重复 使 用 共同 的 业务 逻辑 。 


当 部 署 C/S 系 统 时 ， 设 计 者 必须 确定 应 用 程序 的 哪些 部 分 应 在 哪 种 计算 资产 上 运行 。 一 个 C/S 应 用 程序 包括 以 下 三 个 软件 
B: 


. 表示 逻辑 ， 由 需要 在 计算 机 屏幕 上 显示 信息 的 任务 组 成 。 对 于 C/S 系 统 ， 这 通常 涉及 GUI 点 击 式 、 拖 放 式 功能 、 交 互 式 帮 
助 程序 和 其 他 易于 使 用 的 功能 。 


: 业务 遇 辑 ， 提 供 终端 用 户 所 需 的 应 用 程序 的 核心 要 素来 操纵 管理 业务 的 信息 。 业 务 逻 辑 对 于 手头 特定 的 业务 是 独一无二 
的 ， 结 合 了 实施 商业 战略 的 方法 、 进 行商 业 交易 的 方法 和 执行 公司 政策 的 方法 。 


“ 数据 库 管理 系统 ， 由 大 多 数 C/S 系 统 使 用 ， 以 安全 的 方式 为 结构 化 数据 提供 快速 访问 ， 并 在 执行 数据 完整 性 时 为 数据 修改 
提供 方便 。 文 件 存储 系统 存储 着 DBMS 管 理 的 数据 〈 并 处 理 不 受 DBMS 管 理 的 数据 ) o 


表示 逻辑 层 是 用 户 看 到 的 屏幕 (或 报告 ) ， 即 图 形 界面 。 应 用 程序 逻辑 层 提供 业务 任务 得 以 实现 的 计算 机 处 理 。 这 两 个 软件 
层 的 下 面 是 数据 管理 层 。 如 果 某 个 业务 任务 需要 来 自 多 个 数据 库 的 信息 ， 数 据 访问 设施 应 与 前 端的 软件 组 件 保 持 一 致 ， 它 们 对 这 
些 软件 组 件 是 透明 的 。 


表示 逻辑 层 是 用 户 看 到 的 屏幕 。 


在 C/S 环 境 中 ， 每 个 组 件 都 足够 独立 ， 可 以 与 其 他 组 件 进行 互 操作 ， 为 终端 用 户 提 供 无 颖 的 端 对 端的 应 用 程序 。 终 端 用 户 不 
需要 知道 通过 网 络 访问 的 单个 组 件 提供 了 应 用 程序 的 功能 。C/S 处 理 允 许 两 个 或 多 个 组 件 的 位 于 不 同 的 计算 平台 或 系统 ， 如 图 
21-1 所 示 。 


客户 端 /服务 器 处 理 


局 域 网 打印 服务 器 


SQL 数据 库 服 务 需 


1g 搭载 DB2 的 大 型 机 


客户 端 计算 机 通常 是 一 台 接 入 网 络 的 个 人 计算 机 。 客 户 端 管理 着 用 户 表示 ， 并 提供 网 络 资源 的 访问 。 当 需要 网 络 服务 时 ， 客 
户 端 会 通过 网 络 发 送 一 个 请 求 给 所 需 的 服务 器 。 


图 21-1 客户 端 / 服 务 器 处 理 


服务 器 通常 由 强大 的 硬件 、 连 接 到 客户 端 所 需 的 网 络 组 件 和 实现 客户 端 所 请 求 的 服务 组 成 。 服 务 器 必须 足够 强大 ， 才 可 以 处 
理 来 自 多 个 客户 端的 多 个 请 求 。 服 务 器 的 及 时 响应 很 重要 ， 可 以 使 客户 端 应 用 程序 看 起 来 像 是 一 个 完整 统一 的 应 用 程序 。 使 用 的 
硬件 (服务 器 ) 可 以 是 一 台 功 能 强大 的 个 人 计算 机 (或 许 有 多 个 CPU) ， 也 可 以 是 一 台 基 于 UNIX 的 机 器 ， 还 可 以 是 一 台中 型 计 
算 机 或 大 型 计算 机 。 表 21-1 列 出 了 几 种 不 同 的 C/s 组 件 层 最 合适 的 计算 平台 的 类 型 。 


表 21-1 C/S 组 件 层 的 硬件 推荐 


组 tt PC | 中 型 机 O 大 型 机 
用 户 表示 [| 不 好 
业务 多 各 视 情况 而 定 通常 不 错 通常 不 错 
数据 库 管 理 pile 


服务 器 的 及 时 响应 很 重要 。 


从 数据 管理 的 角度 来 看 ， 数 据 库 服 务 器 为 客户 端 提供 共享 数据 的 访问 。 服 务 器 必须 对 访问 和 一 些 活动 ， 如 数据 备份 和 恢复 、 
性 能 管理 和 异常 处 理 ， 进 行 控制 。 


当然 ， 建 立 C/s 系 统 需要 坚实 的 网 络 能 力 。 网 络 是 C/s 系 统 和 许多 现代 计算 系统 的 实现 技术 。 没 有 网 络 能 力 ， 计 算 机 化 的 系 


统 就 无 法 彼此 连接 。 
集中 处 理 与 分 布 式 处 理 


集中 处 理 使 用 一 台 通 过 哑 终 端 访问 的 主机 。 个 人 计算 机 可 以 连接 到 一 个 集中 的 系统 ， 但 在 该 系统 中 它们 唯一 的 功能 是 基本 的 
终端 仿真 。 基 于 主机 的 系统 无 法 访问 存储 在 个 人 计算 机 上 的 数据 ， 并 且 任 何 基 于 个 人 计算 机 的 应 用 程序 也 无 法 访问 本 地 桌面 处 理 
的 主机 数据 (不 包括 首先 配置 软件 ， 开 启 个 人 计算 机 到 主机 的 连接 ) 。 有 了 集中 系统 ， 个 人 计算 机 社区 就 与 集成 、 无 缝 处 理 隔 离 
开 了 。 


在 集中 处 理 中 ， 所 有 的 数据 都 存储 在 一 台大 型 的 、 集 中 的 计算 机 上 ， 通 常 是 大 型 机 。 所 有 用 户 运 行 预定 义 的 应 用 程序 (有 时 
也 称 作 遗 留 应 用 程序 ) ， 这 些 程序 为 访问 数据 而 构建 。 集 中 应 用 程序 的 维护 和 移植 对 于 非 大 型 机 计算 机 技术 是 昂贵 的 ， 也 是 困难 
的 。 

在 集中 处 理 中 ， 所 有 的 数据 都 存储 在 一 台大 型 的 、 集 中 的 计算 机 上 。 

分 布 式 处 理 涉及 利用 多 台 计 算 机 实现 一 个 服务 请 求 。 顾 名 思 义 是 将 业务 任务 分 布 或 分 配 在 多 个 处 理 器 中 。 目 的 是 促进 其 在 最 
高 效 的 计算 平台 上 的 处 理 。 一 个 能 够 将 多 人 台 计 算 机 连接 在 一 起 的 网 络 是 分 布 式 处 理 的 首要 前 提 。 此 外 ， 系 统 软件 必须 能 够 为 不 同 
的 计算 机 分 配 任务 。 

另 一 个 术语 是 合作 处 理 ， 有 了 时 会 与 分 布 式 应 用 程序 联系 在 一 起 。 这 指 的 是 两 个 节点 的 功能 ,这 两 个 节点 相互 合作 并 且 共 享 同 
一 个 业务 间 题 的 处 理 任务 。 例 如 ， 一 个 节点 可 能 对 新 输入 的 数据 执行 一 些 基本 的 验证 功能 ， 而 另 一 个 节点 针对 业务 规则 执行 更 为 
严格 的 测试 任务 。 


分 布 式 处 理 使 用 多 台 计 算 机 实现 一 个 服务 请 求 。 


21.1.4 ”C/S 应 用 程序 的 类 型 


在 一 个 C/S 系 统 中 ， 应 用 程序 都 是 模块 化 的 ， 这 样 它 们 可 以 在 两 个 或 多 个 节点 上 运行 。 客 户 端 应 用 程序 对 服务 器 节点 (可 能 
包括 多 个 不 同 的 服务 器 ) 发 出 请 求 ， 这 取决 于 请 求 的 类 型 。 通 过 使 用 软件 模块 ，C/S 处 理 允许 常用 的 软件 和 其 他 请 求 的 资源 都 可 
以 共享 。 

C/S 网 络 的 搭建 可 以 有 各 种 各 样 的 配置 ， 这 取决 于 应 用 程序 的 需求 和 企业 可 用 的 计算 资源 。 请 记 住 ， 一 个 C/S 系 统 通常 包括 
三 个 软件 层 : 逻辑 表示 层 、 应 用 程序 层 或 业务 逻辑 层 和 DBMS。 处 理 在 这 些 层 的 分 布 方式 将 很 大 地 影响 设计 、 部 署 、 易 用 性 和 整 
体 的 响应 时 间 。 这 些 任 务 可 以 通过 如 图 21-2 所 示 的 网 络 以 各 种 方式 进行 分 离 。 图 中 的 第 一 行 和 最 后 一 行 不 是 C/S 模 型 ， 因 为 所 有 
的 处 理 都 是 集中 的 (要么 位 于 一 台 个 人 计算 机 工作 站 ， 要 么 位 于 高 端的 服务 器 ) 。 下 面 介 绍 几 种 C/S 配 置 。 


C/S 网 络 的 搭建 可 以 有 各 种 各 样 的 配置 。 
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7. 表示 业务 逻辑 


网 络 
图 21-2 ”遍布 网 络 的 分 布 式 任务 


图 的 第 2 行 显示 了 一 种 常见 的 C/S 变 异 : 分 布 式 用 户 表 示 模 型 。 在 这 种 模型 中 ， 用 户 表示 逻辑 在 工作 站 客户 端 和 服务 器 之 间 
进行 分 裂 。 客 户 端 执行 图 形 和 菜单 驱动 的 界面 元 素 ， 并 处 理 一 些 任务 ， 例 如 ， 物 理 更 新 屏幕 以 及 界面 和 使 用 。 其 他 表示 级 的 任 
务 ， 如 数据 验证 ， 既 可 以 在 客户 端 执行 ， 也 可 以 在 服务 器 端 执行 。 无 论 如 何 ， 对 于 终端 用 户 ， 表 示 层 看 起 来 就 像 完 全 是 由 工作 站 
在 处 理 的 。 业 务 逻 辑 和 数据 管理 任务 都 在 服务 器 端 执行 。 


图 的 第 3 行 显示 了 非 集中 式 用 户 表示 模型 ， 其 中 所 有 的 逻辑 表示 都 在 客户 端 工 作 站 执行 。 处 理 以 这 种 方式 进行 划分 很 好 , 尤 
其 是 当 C/S 技 术 逐 步 在 一 家 企业 投入 使 用 的 时 候 。 适 合 这 种 模型 的 应 该 是 一 些 需要 作出 调整 ， 但 又 不 需要 根据 业务 需求 进行 重 写 
的 应 用 程序 。 


第 4 行 显示 了 非 集中 的 备用 形式 ， 其 中 一 部 分 业务 逻辑 部 署 在 客户 端 ， 另 一 部 分 则 部 署 在 服务 器 端 。 这 种 模型 的 部 署 和 维护 
都 很 困难 ， 因 为 控制 业务 功能 的 应 用 程序 代码 驻 留 在 多 个 平台 。 


第 5 行 是 集中 数据 管理 模型 ,将 所 有 的 表示 逻辑 和 用 于 业务 任务 的 应 用 程序 逻辑 都 放 在 客户 端 ， 所 有 的 数据 访问 和 管理 软件 
在 服务 器 端 。DBMS 数 据 库 服务 器 处 理 所 有 的 数据 请 求 和 修改 。 这 就 为 管理 和 控制 企业 信息 提供 了 一 个 安全 的 环境 。 这 也 有 助 于 
确保 高 度 的 数据 完整 性 。 


第 6 行 显示 了 一 种 替代 性 的 方法 : 分 布 式 数据 管理 模型 ， 其 中 数据 既 可 以 驻 留 在 客户 端 节点 ， 又 可 以 驻 留 在 服务 器 端 。 这 种 
方法 的 优势 在 于 本 地 DBMS 的 查询 速度 比较 快 。 从 维护 的 角度 来 看 ， 需 要 大 量 分 布 式 DBMS 的 管理 更 加 复杂 。 考 虑 ATM 的 工作 
方式 ， 如 果 你 使 用 本 行 的 ATM ， 响 应 时 间 通 常会 比较 快 。 这 是 因为 你 的 账户 的 事务 访问 信息 就 位 于 本 地 银行 的 服务 器 上 (或 许 
是 一 台大 型 计算 机 ) 。 但 是 ， 如 果 你 跨行 使 用 ATM ， 响 应 时 间 往 往 会 慢 很 多 ， 因 为 事务 需要 经 过 中 央 清 算 所 。 换 句 话说 ,银行 


账户 的 信息 分 布 在 连接 到 清算 所 的 所 有 银行 。 
如 前 面 提 到 的 ， 第 7 行 不 是 C/S 系 统 ， 它 是 一 个 位 于 客户 端 机 器 上 的 集中 系统 。 
作为 一 名 DBA， 你 需要 协助 C/s 应 用 程序 开发 人 员 确 定数 据 的 最 佳 位 置 ， 包 括 效率 方面 、 易 于 管理 方面 和 DBM3 能 力 方面 。 


当然 ， 并 不 是 每 一 种 C/S 模 型 都 可 以 由 目前 一 直 使 用 的 简单 图 表 进 行 充 分 地 描述 。 实 际 上 ， 现 在 使 用 的 C/S 模 型 都 是 多 屋 实 
施 ， 如 图 21-3 所 示 。 


现在 使 用 的 C/S 模 型 都 是 多 层 实施 。 
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图 21-3 ”多 层 C/S 实 施 


在 这 种 C/S 实 施 中 ， 部 署 了 两 个 服务 器 : 一 个 用 于 应 用 程序 ; 另 一 个 用 于 DBMS。 客 户 端 处 理 所 有 的 (或 大 部 分 ) 逻辑 表示 
任务 。 这 是 许多 流行 的 第 三 方 应 用 程序 所 部 署 的 模型 ， 如 SAP ERP、Oracle 的 PeopleSoft 和 Siebel 的 应 用 程序 。 支 持 这 样 的 应 
用 程序 需要 网 络 专 业 知识 和 高 度 横 跨 多 个 平台 的 知识 (因为 每 一 层 的 实施 都 使 用 了 不 同类 型 的 计算 机 ) 。 


瘦 客 户 端 或 胖 客 户 端 


分 布 式 与 非 集中 式 用 户 表 示 的 C/S 实 施 有 时 也 称 作 疲 客户 端 ， 因 为 只 有 有 限 的 功能 驻 留 在 客户 端 计算 机 。 大 多 数 处 理 出 现在 
客户 端的 C/S 模 型 称 作 胖 客户 端 。 回 去 查阅 图 21-2， 其 中 往 下 的 行 代表 胖 客 户 端 实施 (尤其 是 第 3、 第 6 行 ) ， 因 为 驻 留 在 客户 端 
的 逻辑 比 服务 器 端的 多 。 


现代 的 多 层 分 布 式 应 用 程序 更 喜欢 瘦 客 户 端 实施 ， 因 为 它 更 容易 管理 和 升级 。 当 程序 逻辑 驻 留 在 企业 内 多 个 客户 端 时 ， 将 变 
更 分 布 到 成 百 上 干 或 成 干 上 万 的 节点 非常 困难 。 


实际 上 ， 大 多 数 现代 应 用 程序 的 主要 客户 端 接口 是 浏览 器 。 


现代 C/S 应 用 程序 更 喜欢 瘦 客 户 端 。 


21.2 ”网 络 流量 


在 一 般 情况 下 ， 网 络 流量 是 导致 C/S 和 多 层 应 用 程序 性 能 低下 的 主要 原因 。 通 过 网 络 发 送 的 数据 越 少 ， 性 能 就 越 好 。DBA 应 
寻找 机 会 减少 通过 网 络 友 送 的 请 求 的 大 小 ， 无 论 从 客户 端 到 服务 器 端 ， 还 是 由 服务 器 返回 给 客户 端 。 存 储 过 程 可 能 是 一 种 有 用 的 
策略 ， 因 为 在 网 络 上 调用 存储 过 程 所 需 的 带宽 通常 小 于 发 出 几 个 SQL 语 句 所 需 的 带宽 。 此 外 ， 如 果 存 储 过 程 设计 得 当 ， 它 可 以 在 
服务 器 端 执行 多 个 请 求 ， 并 只 向 客户 端 返回 需要 的 数据 。 这 有 助 于 减少 网 络 流量 。 


网 络 流量 是 导致 C/S 和 多 层 应 用 程序 性 能 低下 的 主要 原因 。 


还 有 其 他 方法 可 以 减少 网 络 流量 。 例 如 ， 设 计 应 用 程序 来 减少 单独 网 络 请 求 的 数量 。 或 许可 以 将 几 个 请 求 组 合 或 合并 在 一 起 
来 减少 网 络 调用 。 


为 了 减少 网 络 流量 ，DBA 应 该 对 DBM 所 使 用 的 数据 分 布 方法 的 配置 选项 和 数据 库 网 关 的 选项 进行 检查 。 


21.2.1 数据 库 网 关 
为 了 让 应 用 程序 通过 网 络 访问 数据 库 ， 效 据 库 网 关 软件 是 必需 的 。 数 据 库 网 关 人 允许 客户 端 访问 存储 在 数据 库 服务 器 上 的 数 
据 。 主 要 DBMS 供 应 商都 提供 了 适合 各 自 DBMS 产 品 的 网 关 软 件 ， 还 有 一 些 第 三 方 供应 商 也 提供 了 更 为 异 质 性 的 产品 。 


当选 择 数据 库 网 关 时 ， 你 需要 知道 要 访问 的 数据 库 的 类 型 和 使 用 的 网 络 协议 。 例 如 ， 如 果 必 须 访问 DB2 和 Oracle 数 据 库 ， 那 
么 网 关 需 要 同时 支持 这 些 DBMS 产 品 。 同 样 地 ， 如 果 使 用 了 TCP/IP 和 SNA 的 网 络 组 合 ， 网 关 可 能 需要 支持 多 种 网 络 协议 。 示 例 
数据 库 的 网 关 产 品 包 括 IBM 的 DB2 Connect、DataDirect 的 Shadow 和 Oracle Database Gateways, 


DBA 设 置 与 配置 数据 库 网 关 软 件 ， 通 常 需 要 网 络 专员 的 协助 。 当 设置 数据 库 网 天 时 ， 你 需要 决定 是 在 每 一 台 客 户 端 机 器 上 
都 安装 网 天 ， 还 是 建立 一 台 服 务 器 来 处 理 所 有 的 连接 请 求 。 如 果 是 前 者 ， 在 数据 库 网 天 软件 升级 期 间 调 整 软件 分 布 会 比较 困难 ; 
后 者 可 以 简化 软件 升级 ， 但 需要 连接 请 求 路 由 到 所 连接 的 服务 器 。 


此 外 ， 配 置 过 程 可 能 需要 DBA 配 置 参 数 或 升级 系统 目录 表 ， 来 确定 数据 库 网 关 的 位 置 和 所 使 用 的 网 络 协议 。 正 确 安装 并 配 
置 数据 库 网 关 往往 是 最 苛刻 、 最 困难 的 DBA 任 务 之 一 。 


网 关 可 能 需要 支持 多 种 网 络 协议 。 
数据 库 网 天 的 一 些 功能 包括 : 


. 位 置 透明 化 ， 这 意味 着 用 户 不 需要 关注 数据 的 物理 位 置 ， 只 需 知道 要 访问 的 表 的 名 字 。 


- 提交 透明 化 ， 这 意味 着 使 用 标准 的 SQL COMMIT 提 交 分 布 式 和 本 地 事务 。 


* 两 阶段 COMMIT， 这 意味 着 分 布 式 事务 适当 跨越 异 构 数 据 库 系 统 提 交 数 据 。 


- 数据 类 型 在 不 同 的 DBMS 产 品 之 间 自 动 翻译 。 


所 有 异 构 DBMS 产 品 的 查询 和 更 新 能 力 。 


21.2.2 ”数据 库 驱 动 程序 


应 用 程序 可 以 使 用 数据 库 驱 动 程序 访问 数据 库 ， 数 据 库 驱动 程序 是 一 种 使 用 标准 API (ODBC 或 JDBC) 的 软件 组 件 。 其 主要 
功能 是 进行 API 调 用 、 向 数据 库 提 交 SQL 请 求 和 返回 请 求 给 应 用 程序 。 


数据 库 驱 动 程序 在 网 络 上 通过 使 用 数据 库 协议 数据 包 (通常 使 用 TCP/IP 传 送 ) 向 数据 库 服 务 器 发 出 请 求 并 从 中 检索 数据 。 
尽管 核心 数据 库 驱动 程序 的 功能 听 起 来 很 简单 ， 性 能 可 能 差异 很 大 。 应 用 程序 性 能 的 显著 提升 (或 下 降 ) 很 可 能 基于 数据 库 驱动 
程序 的 改变 。 


数据 库 驱 动 将 标准 的 API 翻 译 成 更 低级 别 的 数据 库 请 求 。 当 然 ， 数 据 库 驱动 还 执行 其 他 任务 ， 如 数据 转换 、 缓 冲 、 容 错 处 理 
和 了 映射、 负载 均 衡 、 连 接 池 等 。 数 据 库 驱 动 与 数据 的 通信 方式 取决 于 它 本 身 的 架构 。 有 些 数据 库 驱 动 与 数据 库 直 接 通信 ， 而 有 些 
则 需要 协议 转化 。 数 据 库 驱动 执行 所 有 这 些 功能 的 方式 可 以 对 数据 库 应 用 程序 的 性 能 产生 重大 影响 。 


数据 库 驱 动 的 类 型 


第 一 种 数据 库 驱 动 是 ODBC 驱 动 。 应 该 记得 ， 第 5 章 曾 经 提 到 的 ODBC (开放 式 数 据 库 连 接 ) 是 一 种 用 于 访问 数据 库 服务 器 
上 的 数据 的 标准 C 编 程 语言 接口 。 理 论 上 ，ODBC 是 独立 的 ， 可 以 跨 多 个 DBMS 和 操作 系统 。 实 际 上 ，ODBC 驱 动 需要 对 应 用 到 
数据 库 服务 器 的 请 求 进行 翻译 。 应 用 程序 使 用 ODBC 驱 动 管 理 所 链接 的 ODBC 功 能 ， 该 驱动 程序 还 向 DBM 传递 查询 。ODB(C 数 
据 库 驱动 程序 软件 的 提供 商 有 很 多 。 


随 着 Java 的 兴起 和 普及 ， 一 种 类 似 的 基于 CLI 的 技术 被 用 于 Java 程 序 和 数据 库 系统 之 间 的 通信 。 因 此 引入 了 JDBC 的 概念 
(Java 数 据 库 连 接 ) 。JDBC 驱 动 提供 与 ODBC 驱 动 相同 的 功能 ,但 是 有 四 种 不 同类 型 的 JDBC 数 据 库 驱 动 ， 它 们 的 架构 有 着 明显 
的 区 别 。 


桥架 构 是 第 一 种 类 型 的 数据 库 驱 动 。 这 种 类 型 的 数据 库 驱 动 (也 称 作 Type 1 驱动 ) 是 一 种 标准 到 另 一 种 标准 的 桥梁 。 一 种 
Type 1 的 JDBC 驱 动 程序 接受 JDBC 的 调用 ， 并 将 这 些 调用 与 DODBC 调 用 连接 起 来 一 起 发 送 给 数据 库 。Type 1 驱动 程序 是 一 种 依赖 
使 用 ODBC 的 平台 ， 反 过 来 ODBC 又 依赖 Java 虚 拟 机 (JVM) 所 运行 的 底层 操作 系统 的 原生 库 。Type 1 驱动 程序 在 性 能 和 安全 方 
面 通 常 不 是 最 佳 的 ， 更 有 甚 者 ， 它 可 能 不 支持 新 的 功能 。 


第 二 种 类 型 的 数据 库 驱 动 是 基于 客户 端的 。 这 种 类 型 的 驱动 (也 称 作 原 生 或 Type 1 驱动 程序 ) ,通过 DBMS 的 客户 端 软件 
与 数据 库 进 行 通信 。 换 句 话说 ，Type 2 驱动 程序 是 专 有 的 。 或 许 Type 2 驱动 程序 最 大 的 缺点 是 在 每 一 台 客 户 端 安装 、 配 置 和 软 
件 维护 的 管理 开销 。 每 当 安装 一 个 新 版 本 的 DBMS 时 ， 一般 都 必须 在 所 有 客户 端 安装 一 个 新 版 本 的 Type 2 驱动 程序 。 


第 三 种 类 型 的 数据 库 驱 动 使 用 了 网 络 协议 架构 ， 也 称 作 Pure Java 或 Type 3 驱动 。Type 3 驱动 使 用 调用 程序 和 数据 库 之 间 的 
一 个 中 间 层 ， 将 调用 转换 成 指定 供应 商 的 数据 库 协 议 。 它 可 以 提供 比 前 两 种 驱动 更 好 的 性 能 ， 因 为 它 降低 了 网 络 带宽 的 需求 并 消 
除了 延迟 。 由 于 客户 端 与 服务 器 端的 通信 和 是 独立 于 数据 库 的 ， 因 此 ， 没 有 必要 在 客户 端 安装 供应 商 软件 。 而 且 也 没有 必要 专门 针 
对 新 的 DBM 版 本 更 新 客户 端 中 间 件 软件 。 主 要 的 缺点 是 中 间 层 需要 数据 库 的 特定 编码 。 


第 四 种 类 型 的 数据 库 驱 动 直接 与 DBMS 进 行 通 信 ， 不 再 需要 客户 端 软件 。 在 这 几 种 类 型 的 数据 库 驱动 中 ， 数 据 库 有 线 驱动 


(也 称 作 Type 4 驱动 ) 提供 了 最 好 的 性 能 和 可 维护 性 。Type 4 驱动 程序 安装 在 客户 端 JVM 内 部 。 它 可 以 提供 比 前 两 种 驱动 程序 
更 好 的 性 能 ， 因 为 它 没有 将 调用 转换 成 ODBC 或 数据 库 API 调 用 的 开销 。 并 且 ， 与 Type 3 驱动 程序 不 同 ， 它 不 需要 相关 软件 的 参 
5. Type 4 驱动 程序 可 以 立即 连接 到 | 数据库， 不 需要 配置 额外 的 软件 。 因 为 没有 客户 端 软件 安装 、 配 置 和 维护 ，DBA 支 持 这 种 
类 型 的 驱动 程序 的 工作 量 是 最 小 的 。 


指导 


一 般 情 况 下 ， 你 应 努力 减少 在 数据 库 驱 动 与 数据 库 服 务 器 之 间 进 行 通信 的 数据 量 。 对 这 种 性 质 的 网 络 流量 限制 越 多 ， 应 用 程 
序 的 执行 就 越 好 。 


21.2.3 ”连接 池 
需要 网 络 连 接 的 数据 库 应 用 程序 可 以 使 用 连接 池 来 提升 性 能 。 当 应 用 程序 请 求 连接 时 ， 启 用 连接 池 可 以 从 以 前 所 使 用 的 连接 
池 中 获得 请 求 的 连接 。 当 连接 不 再 需要 时 (而 不 是 关闭 ) ， 它 就 会 保存 在 一 个 连接 池 中 。 


连接 池 仪 是 一 个 使 数据 库 保持 连接 状态 的 缓存 ， 以 便 将 来 需要 数据 库 请 求 时 ， 可 以 重用 该 连接 。 当 重用 连接 时 ,创建 连接 的 
开销 就 不 存在 。 这 也 不 需要 变更 应 用 程序 的 代码 。 


连接 池 可 以 由 应 用 程序 服务 器 实现 或 在 数据 库 驱动 程序 内 部 实现 。 需 要 参数 对 连接 池 最 初 的 、 最 小 的 和 最 大 的 进行 设置 ， 并 
且 对 连接 可 以 在 池 中 保持 的 时 长 进行 配置 。 


21.3 数据库、 互联 网 和 Web 


数据 库 一 旦 接 入 网 络 ， 将 数据 库 连 接 到 Web 就 不 像 管理 数据 库 那样 困难 。 与 任何 服务 器 一 样 ， 通 过 Web 访 问 数据 库 的 唯一 
方式 是 开启 数据 库 服务 器 与 互联 网 之 间 某 种 形式 的 通信 连接 。 这 可 以 通过 多 种 方式 实现 ， 从 缓慢 且 简 单 的 拨号 连接 到 使 用 帧 中 
继 、ISDN 或 T1 和 T3 线 路 的 快速 连接 。 当 然 ， 你 还 可 以 选择 使 用 互联 网 服务 提供 商 (ISP) 来 托管 网 站 和 Web 应 用 程序 使 用 的 数 
据 库 。 


许多 大 型 企业 选择 自己 托管 数据 库 ， 而 不 是 将 它们 交 给 1SP。 通 过 托管 自己 的 数据 库 ， 可 以 对 数据 进行 更 好 的 控制 : 驻 留 在 
本 地 的 数据 ， 即 使 网 络 连 接 出 现 故 障 ， 它 也 是 可 访问 的 ， 也 更 容易 受 保护 。 当 1SP 托 管 数据 库 时 ， 数 据 受 控 于 外 部 实体 而 不 是 你 
的 企业 。 这 对 于 较 小 的 数据 库 、 非 关键 性 数据 或 缺乏 在 DBMS 环 境 中 管理 数据 库 能 力 的 非常 小 的 企业 也 许可 以 接受 。 


通过 托管 自己 的 数据 库 ， 可 以 对 数据 进行 更 好 的 控制 。 


当 安 装 、 配 置 和 维护 运行 在 某 个 服务 器 上 的 软件 (DBMS) 时 ,一 些 服务 提供 商 仅 设置 和 启用 该 服务 器 的 硬件 。 这 可 能 是 将 
所 有 的 控制 权 交 给 1SP 之 后 的 某 种 妥协 。 将 数据 库 服务 器 交 给 1SP 托 管 可 以 显著 降低 成 本 ， 因 为 专用 连接 相当 昂贵 。 


当 托 管 专门 为 互联 网 用 户 提 供 服务 的 数据 库 服务 器 时 ， 遵 循 下 面 的 指导 会 很 有 帮助 : 


| 支持 数据 库 服务 器 专用 硬件 。 不 要 在 同一 计算 机 上 混合 使 用 Web 服 务 器 软件 和 数据 库 服务 器 软件 。 专 用 硬件 使 数据 库 和 


Web 资 源 分 开 进 行 调整 和 管理 更 加 容易 。 


. 支持 使 用 最 快 的 网 络 连接 ， 将 应 用 程序 逻辑 连接 到 数据 库 服务 器 ， 并 且 将 数据 库 服 务 器 连接 到 互联 网 。 网 络 连接 速度 越 
快 ， 性 能 将 越 好 。 


21.3.1 接 入 互联 网 的 数据 库 


各 企业 都 在 迅速 采用 各 种 互联 网 技术 ， 并 将 它们 集成 到 各 自 的 业务 流程 。 换 句 话说 ， 业 务 正成 为 一 种 电子 商务 。 然 而 ， 当 涉 
及 管理 接 入 互联 网 的 数据 库 时 ，DBA 的 工作 变 得 更 加 困难 。Web 数 据 库 管 理 复杂 化 的 首要 原因 是 对 可 用 性 依赖 的 增加 。 
可 用 性 


因为 电子 商务 是 一 种 在 线 业 务 ， 永 不 打 料 。 再 也 没有 一 种 东西 像 电 子 商 务 应 用 程序 的 批 处 理 窗口 那样 。 顾 客 期 望 Web 永 远 
可 用 ,无 论 什 么 时 间 。 要 知道 ，Web 是 世界 范围 的 ， 芝 加 哥 半 夜 时 分 ,澳大利亚 的 悉尼 可 能 是 下 午 三 点 。 电 子 商 务 需 要 一 直 营 
业 且 一 天 24 小 时 一 年 366 天 (HF) 和 顾客 打交道 ， 否 则 就 会 造成 损失 。 有 研究 表明 ， 如 果 Web 用 户 点 击 鼠 标 后 在 7 秒 钟 之 内 浏 
览 器 没有 收 到 传输 回 的 数据 ， 他 们 将 放弃 这 一 请 求 ， 去 其 他 地 方 。 


电子 商务 永 不 打 立 。 


最 终 的 结果 是 电子 商务 企业 之 间 的 连通 性 更 好 ， 因 此 使 用 起 来 更 加 方便 。 随 着 电子 商务 企业 将 Web 领 域 与 传统 的 !T 服 务 如 
数据 库 管 理 系 统 集成 在 一 起 ， 它 们 在 创建 数据 可 用 性 时 期 望 更 高 。 实 际 上 ， 术 语 e-vailability 有 时 用 于 描述 基于 Web 的 数据 库 的 
可 用 性 需求 的 增加 。 


e-vailability 描 述 了 保持 电子 商务 的 运作 所 需 的 可 用 性 级 别 。 停 机 时 间 和 中 断 是 e-vailability 的 敌人 。 回 想 一 下 第 8 章 的 讨 
论 : 70% 的 应 用 程序 停机 时 间 是 由 系统 的 计划 内 中 断 造 成 的 ， 而 只 有 30% 是 由 于 计划 外 中 断 。 


停机 时 间 和 中 断 是 e-vailability 的 敌人 。 


但 e-DBA 到 底 意 味 着 什么 ”e-DBA 承 担 着 维持 电子 商务 所 需 的 高 度 的 可 用 性 ， 首 先 就 是 要 尽量 减少 由 计划 内 中 断 造 成 的 停 
机 时 间 。 那 么 ， 如 何 才 能 做 到 这 一 点 呢 ? 减少 停机 时 间 的 最 佳 方式 是 避免 它 。 可 以 采取 以 下 步骤 来 避免 或 减少 停机 时 间 : 


- 系统 保持 正常 运行 的 同时 ， 执 行 正常 维护 工作 。 
- 充分 利用 DBMS 的 功能 来 促进 可 用 性 。 

将 DBA 的 工作 自动 化 。 

“ 考虑 高 速 工具 和 第 三 方 自动 化 解决 方案 。 
:充分 利用 硬件 技术 。 


这 些 技术 在 第 8 章 有 详细 的 介绍 。 然 而 ， 停 机 时 间 是 无 法 避免 的 。 这 种 情况 下 ， 快 速 执行 任务 可 能 会 缩短 中 断 的 时 间 。 一 定 
要 确保 你 使 用 的 是 最 快 、 最 不 容易 出 错 的 技术 。 例 如 ， 如 果 第 三 方 的 RECOVER、LOAD 或 REORG 实 用 程序 的 运行 时 间 是 传统 数 
据 库 实 用 程序 的 一 半 或 四 分 之 一 ， 可 以 考虑 使 用 较 快 的 技术 。 在 许多 情况 下 ， 由 于 可 用 性 需求 的 日 益 增 长 ， 较 快 的 技术 在 电子 商 
务 中 比 在 传统 商业 中 收回 成 本 的 速度 更 快 。 


快速 执行 任务 可 能 会 缩短 中 断 的 时 间 。 


另外 一 种 可 以 减少 停机 时 间 的 方法 是 将 日 常 维护 任务 自动 化 。 例 如 ， 回 想 一 下 第 7 章 ， 如 何 变更 数据 库 的 结构 是 一 项 艰难 的 
任务 。 工 具 可 以 让 DBA 使 用 简单 的 在 线 接口 对 关系 数据 库 作出 任何 所 需 的 变更 。 使 用 工具 指向 、 点 击 和 选择 ， 可 以 生成 自动 化 
所 需 的 数据 库 变更 的 脚本 。 使 用 自动 化 可 以 避免 出 错 ， 减 少 停 机 时 间 ， 从 而 导致 更 强 的 e-vaiability。 第 7 章 对 数据 库 变更 管理 的 
问题 进行 了 广泛 的 覆盖 。 
数据 库 设计 

当 为 电子 商务 应 用 程序 设计 数据 库 时 ，DBA 一 般 很 难 在 基于 网 络 的 设计 和 开发 中 获得 新 鲜 感 。 这 可 能 是 数据 库 设计 的 一 个 
危险 的 错误 。 接 下 来 探讨 电子 商务 会 对 设计 过 程 产生 什么 影响 ， 并 对 确保 正确 的 数据 库 设 计 的 基础 知识 稍 作 讨 论 。 

从 传统 开发 转移 到 电子 商务 开发 的 过 程 中 ，DBA 可 能 会 遇 到 的 最 大 问题 之 一 是 如 何 应 对 “马上 完成 ” 带 来 的 疯狂 工作 。 业 
内 权威 人 士 发 明了 “上 网 时 间 ” 来 描述 这 种 现象 。 基本 上 ， 当 一 家 企业 开始 在 “上 网 时 间 “运作 时 ,一切 都 进行 得 更 快 。 一 
个 “Web 月 ”据说 相当 于 三 个 标准 月 。 以 下 也 是 Web 项 目 运作 很 快 的 几 个 原因 : 


" 业务 主管 希望 越 来 越 多 的 业务 可 以 通过 网 络 进行 ， 进 而 节约 成 本 ， 并 可 以 与 他 们 的 客户 保持 更 好 的 联系 。 


* 每 家 企业 都 在 快速 发 展 ， 因 此 ， 你 要 么 也 快速 发 展 ， 要 么 承受 失去 业务 的 风险 。 


当 一 家 企业 开始 在 “上 网 时 间 “ 运 作 时 ， 一 切 都 进行 得 更 快 。 


快速 应 用 程序 开发 (RAD) 技术 已 经 出 现 了 近 30 年 ， 并 且 也 有 不 同 程度 的 成 功 使 用 。 有 时 RAD 对 于 某 些 项 目 是 必需 的 。 但 
RAD 对 数据 库 设 计 可 能 没有 好 处 ， 为 什么 呢 ? 应 用 程序 是 临时 的 ， 但 数据 是 永久 的 。 企 业 永远 都 在 编码 和 重新 编码 应 用 程序 ， 
有 时 还 会 在 发 布 一 个 应 用 程序 版 本 之 前 ， 就 着 手 开发 下 一 个 新 版 本 。 


但 是 ， 你 有 没有 想 过 要 丢掉 数据 ? 当然， 你 可 以 重新 设计 数据 库 或 者 换个 DBMS。 但 是 ， 数 据 怎么 办 ? 实际 情况 是 ， 你 保存 
了 数据 并 将 其 迁移 到 新 的 DBMS。 有 一 些 变更 必须 要 进行 ， 也 许可 以 从 外 部 购买 一 些 数 据 ， 与 现 有 的 数据 结合 ， 但 数据 仍然 存 
在 。 要 获得 数据 的 最 大 价值 ， 明 智 的 做 法 是 在 设计 数据 库 时 就 予以 关注 。 导 航 设计 良好 的 数据 库 很 容易 ， 因 此 从 中 检索 有 意义 的 
数据 也 很 容易 。 第 3 章 和 第 4 章 概述 了 一 些 设计 和 实施 结构 合理 的 数据 库 所 需 的 技术 。 


但 是 ， 如 果 你 不 得 不 设计 “上 网 时 间 ” 的 数据 库 怎 么 办 ? 


好 吧 ， 我 可 以 给 你 的 最 好 建议 是 要 知道 哪些 设计 故障 可 能 会 导致 敌意 数据 库 。 政 意 数 据 库 是 一 种 很 难 理解 、 不 方便 查询 并 且 
需要 伦 大 量 的 精力 改变 的 数据 库 。 当 然 ， 这 里 不 可 能 列 出 所 有 可 能 导致 敌意 数据 库 的 数据 库 设计 流程 。 下 面 来 看 几 种 常见 的 数据 
库 设 计 故 障 。 

要 知道 哪些 设计 故障 可 能 会 导致 敌意 数据 库 。 

初学 者 常 犯 的 一 个 设计 错误 是 分 配 不 适当 的 表 名 和 列 名 。 用 来 存储 数据 的 数据 库 的 名 称 应 该 尽 可 能 具有 描述 性 ， 便 于 表 和 列 


记录 它们 (至 少 在 某 种 程度 ) 。 应 用 程序 程序 员 在 创建 数据 库 名 称 的 问题 上 已 经 声名 狼藉 ， 如 使 用 屏幕 变量 名 作为 列 的 名 称 ， 或 
者 使 用 编码 混乱 的 字母 和 数字 作为 表 的 名 称 。 


在 匆忙 的 时 候 ， 一些 DBA 可 能 会 记 住 数 据 库 的 输出 。 这 可 能 会 导致 在 字符 列 中 存储 数字 等 缺陷 ， 因 为 报告 上 需要 显示 一 些 
前 导 零 。 这 种 做 法 对 关系 数据 库 通 常 是 很 不 好 的 。 如 果 创 建 为 字符 列 ， 开 发 人 员 需 要 使 用 程序 编辑 检查 来 验证 该 列 是 否 只 存储 了 
数字 数据 。 但 是 ， 正 如 前 面 章节 所 讨论 的 ， 对 数据 库 系 统 执行 编辑 检查 对 其 完整 性 和 效率 都 有 好 处 。 因 此 ， 数 据 人 存储 应 根据 它 的 
域 。 用 户 和 程序 员 可 以 格式 化 用 于 显示 的 数据 ， 而 不 是 强制 将 数据 转换 成 数据 库存 储 的 显示 模式 。 


不 要 记 住 数据 库 的 输出 。 


另 一 种 常见 的 数据 库 设 计 问 题 是 列 装填 过 度 。 实 际 上 ， 这 是 规范 化 的 问题 ， 有 时 ， 为 了 方便 ， 一 个 列 人 存储 了 2~ 3 个 列 应 该 存 
储 的 数据 。 如 果 DBA 不 对 数据 的 模式 和 关系 进行 分 析 ， 可 能 会 引入 这 样 的 设计 缺陷 。 举 个 装填 过 度 的 例子 : 一 个 人 的 名 字 存 储 
在 一 列 ， 而 不 是 将 其 分 别 存 储 在 名 字 、 中 间 名 缩写 和 姓氏 三 个 单独 的 列 中 。 

设计 不 当 的 码 可 能 会 破坏 数据 库 的 可 用 性 。 主 码 应 该 是 非 易 失 性 的 ， 因 为 改变 主 码 的 值 非常 昂贵 。 当 试图 改变 某 个 主 码 的 值 
时 ， 你 必须 通过 外 码 将 变更 级 联 传递 到 子 表 。 一 个 常见 的 例子 是 使 用 社会 安全 号 码 作 为 主 码 的 人 员 表 或 客户 表 。 其 中 存在 缺陷 ， 
原因 是 : 首先 ， 社 会 安全 号 码 并 不 唯一 ; 其次， 美国 的 社会 安全 号 码 是 唯一 的 。 因 此 ， 如 果 业 务 向 美国 以 外 扩展 ， 那 么 你 拿 什么 
作为 主 码 呢 ? 

设计 不 当 的 码 可 能 会 破坏 数据 库 的 可 用 性 。 

事实 上 ， 没 有 考虑 国际 问题 可 能 会 有 更 严重 的 后 果 。 例 如 ， 当 存储 地 址 时 ， 如 何 定义 邮 区 编号 或 邮政 编码 ”许多 国家 使 用 的 
邮政 编码 不 一 定 是 数字 。 如 何 定义 州 或 省 ”如 何 保证 捕捉 到 了 每 个 人 的 所 有 信息 ， 无 论 哪个 国家 ”答案 当然 是 : 正确 的 数据 建 模 
和 数据 库 设 计 。 

非 规范 化 是 物理 数据 库 的 一 个 设计 选项 ， 但 只 有 当 设 计 从 一 开始 就 是 规 学 化 的 时 才 可 以 做 到 。 事 实 上 ， 数 据 库 设计 的 根本 问 
题 是 规范 化 不 当 。 通 过 专注 于 规范 化 、 数 据 建 模 和 数据 库 设 计 ， 可 以 避免 创建 敌意 数据 库 。 

前 期 没有 经 过 适当 的 分 析 和 设计 ， 数 据 库 就 不 可 能 足够 灵活 ， 也 就 不 可 能 轻松 应 对 不 断 变 化 的 用 户 需求 ; 准备 充分 ， 数 据 库 
的 设计 足够 灵活 ， 才 可 能 支持 用 户 的 各 种 预期 变化 。 当 然 ， 如 果 在 设计 阶段 没有 调查 用 户 的 预期 需求 ， 那 么 在 创建 数据 库 时 就 无 
法 很 好 地 考虑 这 些 需求 。 

如 果 数 据 是 当今 现代 电子 商务 的 心脏 ， 那 么 数据 库 设计 就 是 保护 心脏 的 盔甲 。 数 据 建 模 和 数据 库 设计 是 创建 数据 库 应 用 程序 
最 重要 的 两 个 部 分 。 如 果 适 当 的 设计 不 是 数据 库 创建 过 程 的 组 成 部 分 ， 那 么 数据 库 会 是 一 个 烂摊子 : 第 一 个 应 用 程序 可 能 工作 正 
常 ， 而 后 续 的 应 用 程序 就 不 一 定 了 。 没 有 人 帮助 开发 人 员 或 DBA， 因 为 不 断 变化 的 业务 需求 ， 他 们 不 得 不 对 数据 库 或 应 用 程序 
进行 变更 。DBA 将 不 得 不 尝试 修复 敌意 数据 库 。 


数据 库 设计 就 是 保护 电子 商务 心脏 的 盔甲 。 


21.3.2 ” Web 开发 和 和 Web 服务 


另 一 种 流行 的 应 用 程序 开发 技术 依赖 Web 服 务 。Web 服 务 是 一 种 为 了 支持 机 器 对 机 器 通过 网 络 的 交互 而 设计 的 软件 系统 。 
其 他 服务 通过 与 Web 服 务 的 交互 而 开展 业务 。 通 常 ，Web 服 务 使 用 面向 服务 的 架构 (SOA) 和 SOAP 消 息 。 


什么 是 SOAP? 


SOAP， 即 简单 对 象 访问 控制 ， 是 一 种 用 于 在 Web 服 务实 施 中 交换 结构 信息 的 协议 规范 。 它 的 消息 格式 基于 XML， 以 及 其 他 
协议 如 HTTP 和 SMTP。 


什么 是 REST? 
其 名 称 “ 表 述 性 状态 转移 ”特意 构建 了 一 种 印象 : 设计 良好 的 应 用 程序 应 如 何 表现 。 用 户 通过 应 用 程序 选择 网 页 中 的 链接 


(状态 过 渡 ) ， 其 中 每 个 链接 跳 转 的 下 一 个 页 面 ( 表 示 应 用 程序 的 下 一 个 状态 ) 都 传送 回 用 户 。 


无 论 如 何 ，Web 服 务 是 一 种 多 层 处 理 的 形式 ， 但 其 设计 使 用 了 可 以 提供 特定 功能 或 服务 的 组 件 。SOA 没 有 定义 APl， 而 是 按 
照 协 议和 功能 定义 了 接口 。SOA 将 功能 分 隔 成 不 同 的 单元 或 服务 ， 开 发 人 员 可 以 通过 网 络 对 它们 进行 访问 ， 从 而 允许 用 户 在 应 


用 程序 的 生成 环境 中 可 以 结合 并 重新 使 用 它们 。 


另 一 种 技术 是 使 用 表述 性 状态 转移 或 REST。REST 风 格 的 架构 基于 客户 端 /服务 器 模型 。 请 求 和 响应 都 是 围绕 资源 的 表述 转 
移 。 资 源 可 以 是 所 能 提出 的 任何 连贯 且 有 意义 的 概念 。 它 通常 是 一 个 文档 ， 捕 获 资 源 当前 或 预期 的 状态 。 


客户 端 在 准备 好 过 渡 到 一 个 新 的 状态 时 会 发 送 请 求 。 只 要 有 一 个 或 多 个 请 求 ， 就 认为 客户 端 处 于 过 渡 状 态 。 每 种 应 用 程序 状 
态 的 表示 中 都 包含 一 些 链接 ， 可 以 在 下 一 次 客户 端 选 择 启动 一 个 新 的 状态 过 渡 时 使 用 。 


REST Web 服 务 的 实施 要 使 用 HTTP 和 REST 法 则 。 另 一 方面 ，SOAP 鼓 励 每 个 应 用 程序 设计 人 员 定 义 新 的 名 词 和 动词 词汇 
表 ， 忽 视 许多 HTTP 已 有 的 能 力 ， 如 认证 、 缓 存 和 内 容 类 型 协商 。 一 些 人 认为 SOAP 的 这 种 做 法 会 导致 大 多 重复 的 工作 。 
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现代 数据 库 的 设计 和 实施 都 是 为 了 跨 网 络 使 用 ， 用 户 可 以 连接 到 来 自 不 同类 型 计算 平台 的 数据 库 。 设 计 、 管 理 和 支持 数据 库 
的 方式 会 对 数据 库 的 使 用 产生 影响 。 客 户 端 /服务 器 和 接 入 网 络 的 数据 库 必须 能 够 克服 不 同 的 问题 。DBA 应 时 刻 准 备 处 理 这 些 问 
题 ， 不 仅 要 精通 如 何 连 接 数据 库 ， 还 要 精通 连接 之 后 如 何 高 效 地 管理 。 


21.5 [elena 


Lisi OMA e ESR, FCS AAA, 

2. 为 什么 说 数据 库 设 计 是 联网 数据 库 应 用 程序 开发 项 目的 潜在 问题 区 ? 

3. 胖 客户 端 与 瘦 客 户 端 之 间 有 什么 区 别 ? 

4. 在 客户 端 /服务 器 环境 中 ， 经 常 有 多 个 客户 端 与 一 台 服 务 器 进行 通信 。 这 种 说 法 正确 与 否 ? 
5. 客 户 端 /服务 器 应 用 程序 包含 哪 三 种 组 件 ? 

6. 当 管理 联网 数据 库 时 ，DBA 所 面临 的 最 大 挑战 是 什么 ? 

7. 什 么 是 连接 池 ? 

8. 请 举例 说 明 : 在 联网 数据 库 设 计 阶 段 可 能 会 引入 的 哪些 缺陷 会 导致 创建 敌意 数据 库 。 


9. 你 所 在 的 企业 部 署 了 个 人 计算 机 、 中 档 系统 和 大 型 机 。 请 对 客户 端 /服务 器 应 用 程序 的 三 个 层次 进行 讨论 ， 并 说 出 每 一 层 


最 适合 的 计算 平台 。 


10. 什 么 是 e-vailability? 
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第 22 章 “元 数据 管理 


为 了 管理 数据 ，DBA 需 要 对 数据 库 所 使 用 的 数据 元 素 进行 管理 和 控制 。 不 了 解数 据 的 结构 、 局 限 和 定义 ， 很 可 能 会 误解 或 
滥用 数据 。 此 外 ， 数 据 定义 不 准确 可 能 会 导致 数据 库 的 完整 性 问题 。 


22.1 “元 数据 简介 


是 否 在 电视 上 看 到 过 Antiques Roadshow [的 节目 ?在 这 档 节 目 中 ， 人 们 带 来 各 种 各 样 的 藏品 给 专业 的 古董 鉴定 师 进行 鉴 
定 和 评估 。 参 与 者 都 希望 他 们 带 来 的 藏品 是 无 价 之 宝 。 上 古董 专家 通常 会 长 时 间 对 所 有 者 讲述 他 们 带 来 的 藏品 。 他 们 经 常会 问 的 问 
题 有 “你 是 从 哪里 得 到 这 件 藏品 的 ? ”以 及 “你 能 说 出 它 的 历史 吗 ?””。 他 们 为 什么 要 问 这 些 问题 呢 ? 因为 从 这 些 问 题 的 答案 中 
可 以 得 知 这 件 藏品 的 真实 性 和 本 质 。 专 家 也 会 很 仔细 地 研究 藏品 ， 以 求 可 以 找到 证 明 藏品 来 历 的 任何 标记 和 日 期 。 


数据 的 用 户 也 必须 能 够 将 数据 还 原 到 其 原始 的 环境 。 数 据 的 信息 也 称 作 元 数据 。 元 数据 最 简单 的 定义 是 “数据 的 数据 ”。 更 
准确 地 说 ， 元 数据 描述 数据 ， 可 以 提供 如 类 型 、 长 度 、 文 本 描述 和 其 他 特征 的 信息 。 例 如 ， 元 数据 使 用 户 知道 客户 编号 是 一 个 五 
位 数 的 数字 字段 ， 而 数据 本 身 可 能 是 56789。 


元 数据 是 “数据 的 数据 ”。 


因此 ， 还 使 用 上 面 的 Antiques Roadshow 的 例子 ， 被 评 佑 的 藏品 是 “数据 ”， 专 家 提出 的 问题 的 答案 和 藏品 上 的 各 种 标记 
“元 数据 ”。 只 有 在 发 现 元 数据 并 对 它 进行 评估 之 后 ， 才 会 给 它 赋予 一 个 值 。 
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元 数据 描述 了 数据 的 特征 。 由 它 形成 的 文档 可 以 使 企业 了 解数 据 ， 并 且 可 以 更 容易 地 使 用 这 些 数 据 。 元 数据 可 以 回答 来 自 数 
据 用 户 的 各 种 问题 ， 例 如 ， 谁 ?是 什么 ?什么 时 间 ? 什么 地 方 ? 怎么 做 ? 


[1] www.pbs.org/webh/roadshow/. 


22.1.1 从 数据 到 和 燥 识 ， 再 到 更 多 

知识 最 基本 的 建筑 单元 是 数据 。 数 据 代 表 脱离 了 上 下 文 背 景 的 某 个 事物 或 某 个 事件 的 事实 ， 与 其 他 事实 无 关 。 举 几 个 有 关 数 
据 的 例子 : 27、JAN 和 010110， 没 有 其 他 信息 ， 我 们 无 法 知道 这 三 个 数据 表示 什么 。 请 考虑 : 

` 27 是 个 十 进 制 的 数字 吗 ? 或 者 八进制 (翻译 成 十 进 制 就 是 23) ? 

" 如 果 27 是 个 十 进 制 的 数字 ， 它 代表 什么 ? 年 龄 ? 美元 面值 ? Q? HA? 或 者 其 他 的 什么 东西 ? 

JANR? 一 个 女性 的 名 字 (或 男性 的 名 字 ) ? 或 者 一 年 的 第 一 个 月 ? 又 或 者 其 他 的 什么 东西 ? 


- 最 后 ，010110 代 表 什 么 ? 一 个 二 进 制 数字 ? 或 者 一 个 日 期 ， 如 1910 年 1 月 1 日 ? 2010 年 1 月 1 日 ? 或 者 其 他 的 什么 东西 ? 


数据 代表 脱离 了 上 下 文 背景 的 某 个 事物 或 某 个 事件 的 事实 。 


由 于 缺乏 上 下 文 背 景 ， 这 些 都 只 能 作为 数据 的 例子 。 另 一 方面 ， 信 息 通过 指定 数据 之 间 ， 或 者 数据 与 其 他 信息 之 间 的 关联 ， 
为 数据 赋予 了 上 下 文 。 数 据 与 元 数据 一 起 构成 了 信息 。 关 联 可 以 代表 信息 ， 而 关系 实际 上 不 会 成 为 信息 ， 除 非 它们 被 人 们 了 解 。 
此 外 ， 代 表 数 据 的 关联 在 上 下 文 背 景 中 很 容易 受 限 ， 更 多 的 是 关于 过 去 和 现在 ， 如 果 不 特别 指出 ， 很 少 是 关于 将 来 的 。 


书 氏 新 大 学 生词 典 将 知识 定义 为 “通过 经 验 或 关联 所 熟知 的 某 些 事物 的 事实 或 者 定义 ”。 知 识 让 信息 变 得 容易 理解 且 便 于 记 
忆 。 它 是 信息 本 质 的 延续 。 要 拥有 “知识 ”， 需 要 将 信息 与 从 数据 、 信 息 和 其 他 知识 中 发 现 的 模式 结合 起 来 。 此 外 ， 知 识 赋予 了 
言 息 理 解 力 和 认 知 能 力 。 


最 后 一 步 是 从 知识 到 智慧 。 智 慧 可 以 想象 成 实用 的 知识 。 你 可 能 知道 高 脂肪 的 食物 对 健康 有 害 ， 但 是 还 要 吃 ， 这 就 是 不 明智 
的 。 


为 了 使 数据 不 仅 是 数据 ， 元 数据 是 必需 的 。 没 有 元 数据 ， 数 据 就 没有 可 辨识 的 意义 。 可 能 只 是 一 堆 数 字 、 字 符 或 位 。 元 数据 
赋予 了 数据 格式 ， 并 为 信息 专家 所 用 。 


智慧 可 以 想象 成 实用 的 知识 。 


22.1.2 元 数据 策略 


明智 的 企业 会 制定 一 套 元 数据 策略 来 收集 、 管 理 并 提供 访问 元 数据 的 工具 。 合 理 的 元 数据 策略 应 解决 下 面 的 问题 : 
" 如 何在 企业 内 使 用 元 数据 的 政策 。 

识别 并 定义 数据 所 有 关系 和 管理 关系 的 程序 。 

“ 识别 需要 收集 的 元 数据 的 类 型 。 

描述 每 种 已 识别 的 元 数据 的 用 途 ， 企 业 需 要 该 元 数据 的 合理 理由 。 

“ 收集 和 存储 元 数据 (通常 使 用 仓库 ) 的 方法 。 

:访问 元 数据 的 方法 。 

:强制 执行 数据 管理 程序 和 元 数据 访问 安全 的 政策 。 

:识别 元 数据 源 ， 包 括 内 部 的 和 外 部 的 。 

.评估 元 数据 质量 和 可 用 性 的 标准 。 


元 数据 公开 并 支持 企业 所 产生 和 维护 的 数据 。 通 过 装配 和 管理 元 数据 ， 企 业 将 对 数据 的 相关 事实 有 所 了 解 ， 这 使 得 系统 和 数 
据 库 都 更 加 可 用 。 


DBA 应 该 参与 开发 元 数据 策略 ， 但 数据 管理 组 织 (如 果 存 在 ) 应 作为 元 数据 相关 事务 的 领导 者 。 


数据 主管 有 责任 采取 行动 使 用 定义 了 的 数据 集 。 数 据 管理 政策 要 识别 出 企业 内 负责 创建 、 维 护 和 删除 数据 的 个 人 。 数 据 主管 
不 一 定 是 数据 的 所 有 者 。 综 合 的 数据 管理 政策 还 需要 给 出 数据 用 户 的 定义 ， 即 在 工作 中 直接 使 用 数据 的 人 。 


22.1.3 ”数据 仓库 和 元 数据 


部 署 数据 仓库 系统 的 公司 比 其 他 公司 更 有 可 能 开始 着 手 元 数据 管理 策略 。 在 数据 应 用 到 业务 之 前 ， 用 户 需要 知道 这 些 仓储 在 
数据 仓库 中 的 数据 的 准确 信息 。 因 此 ， 这 样 的 业务 对 现 有 且 高 品质 的 元 数据 有 迫切 的 要 求 。 然 而 ， 有 时 如 果 元 数据 的 捕获 和 管理 
早 于 数据 仓库 的 创建 ， 就 没有 这 种 要 求 。 


22.2 ”元 数据 的 类 型 


尽管 所 有 的 元 数据 都 可 以 描述 数据 ， 元 数据 有 许多 不 同 的 类 型 和 源 。 它 们 从 根本 上 分 为 两 种 类 型 : 技术 元 数据 或 业务 元 数 
据 。 技 术 元 数据 描述 了 数据 的 技术 方面 ， 因 为 它 与 计算 系统 存储 和 管理 数据 有 关 。 另 一 方面 ， 业 务 元 数据 描述 了 业务 如 何 使 用 以 
及 需要 对 企业 有 价值 的 数据 。 例 如 ，LICNO 列 是 介 于 1~9999999 的 正 整 数 是 一 个 技术 元 数据 的 例子 。 当 然 ， 业 务 用 户 也 需要 这 
个 信息 。 但 如 果 前 面 提 到 的 编号 LICNO 是 认证 课程 导师 的 从 业 许 可 证 编号 (必须 是 唯一 的 ) ， 每 一 位 导师 有 且 只 有 一 个 许可 证 
编号 则 是 一 个 业务 元 数据 的 例子 (尽管 这 些 细节 对 DBA 创 建 适当 且 有 效 的 数据 库 也 很 有 用 ) 。 


所 有 的 元 数据 都 有 两 种 类 型 :技术 元 数据 或 业务 元 数据 


对 于 DBA，DBMS 本 身 就 是 一 个 很 好 的 元 数据 源 。 用 来 存储 数据 库 对 象 信息 的 系统 目录 是 DBA 元 数据 至 天 重要 的 存储 ( 技 
术 元 数据 ) 。DBA 和 开发 人 员 在 DBMS 系 统 目录 中 使 用 的 元 数据 可 以 帮助 他 们 更 好 地 理解 数据 库 对 象 以 及 包含 其 中 的 数据 。 根 据 
不 同 的 DBMS， 用 户 可 以 针对 系统 目录 表 或 视图 编写 查询 ， 或 者 他 们 可 以 使 用 系统 提供 的 人 存储 过 程 ， 返 回 系统 目录 表 的 元 数据 。 
几乎 任何 类 型 的 数据 组 成 相关 的 描述 性 信息 都 可 以 在 系统 目录 中 找到 。 例 如 ， 大 多 数 DBMS 在 系统 目录 中 存储 了 下 面 的 元 数据 : 


- 每 一 个 数据 库 、 表 、 列 、 索 引 、 视 图 、 关 联 、 存 储 过程 和 触发 器 等 的 名 称 。 

* 每 个 表 的 主 码 ， 以 及 任何 引用 该 主 码 的 外 码 。 

“ 哪些 视图 中 的 哪些 表 ? 

* 每 个 表 的 每 一 列 的 数据 类 型 、 长 度 和 约束 。 

> 用 于 存储 数据 库 数据 的 物理 文件 的 名 称 ， 以 及 有 关 文 件 存 储 、 扩 展 和 磁盘 卷 的 信息 。 
详 述 哪些 用 户 拥有 哪些 数据 库 对 象 的 什么 类 型 权限 的 授权 和 安全 信息 。 

“ 最 后 一 次 数据 库 定 义 变更 的 日 期 和 时 间 ， 以 及 实施 该 变更 的 DDL 的 用 户 ID。 
数据 库 的 企业 信息 。 


DBMS 系 统 目 录 是 一 种 特别 有 效 的 元 数据 源 ， 因 为 它 是 活路 的、 集成 的 和 不 可 改变 的 。 系 统 目 录 是 活跃 的 ， 因 为 当 创 建 和 修 
改 数据 库 对 象 时 ， 元 数据 会 自动 构建 和 维护 。 因 为 DBA 创 建 数 据 库 ，DBMS 会 自动 收集 并 向 系统 目录 填充 元 数据 。 系 统 目录 和 
DBMS 是 集成 的 ， 连 同系 统 目录 的 活跃 本 质 ， 一 起 保证 了 系统 目录 中 技术 元 数据 的 准确 和 最 新 。 此 外 ，DBMSs 系 统 目录 又 是 不 可 
改变 的 ， 意 味 着 一 般 的 DBM 操作 是 填充 系统 目录 的 唯一 机 制 。 当 然 ， 系 统 目 录 的 不 可 改变 性 也 因 DBMS 的 不 同 而 有 所 不 同 。 有 
些 DBMS 提 供 开启 系统 目录 直接 更 新 的 选项 ， 但 这 样 的 选项 只 可 以 在 紧急 情况 下 使 用 ， 并 且 一 般 要 在 DBMS3 供 应 商 的 技术 支持 人 


员 的 指导 下 进行 。 
DBMS 系 统 目 录 是 一 种 特别 有 效 的 元 数据 源 。 


虽然 在 系统 目录 中 有 大 量 的 元 数据 ， 但 是 DBMS 元 数据 通常 也 不 足以 充分 地 描述 数据 。 例 如 ， 数 据 库 对 象 的 描述 在 DBMS 系 
统 目 录 中 就 不 常见 。 有 些 DBMS 提 供 了 系统 目录 描述 列 ， 在 DBA 的 支配 下 进行 填充 。 然 而 ,许多 DBA 害 怕 将 系统 目录 弄 乱 而 避 
免 使 用 该 列 。 在 数据 库 对 象 创建 的 时 候 ， 该 对 象 的 摘 述 也 可 能 无 法 使 用 。 其 他 一 些 有 用 却 不 包含 在 系统 目录 的 元 数据 有 : 


> 非 数 据 库 文件 的 元 数据 (平面 或 顺序 文件 ) o 
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“数据库 表 (或 非 数 据 库 文件 ) 的 副本 信息 ， 以 及 哪些 程序 使 用 该 信息 。 

> 访问 数据 的 批 处 理 作业 和 业务 信息 。 

:IT 基 础 设施 组 件 的 操作 元 数据 。 

- 用 来 描述 逻辑 数据 库 设 计 和 该 设计 如 何 上 映射 到 物理 数据 库 部 署 的 数据 模型 元 数据 。 
“ 数据 仓库 和 定义 数据 源 、 记 录 系 统 等 分 析 信 息 的 ETL 元 数据 。 

" 数据 所 有 权 和 元 数据 的 管理 。 


当然 ， 这 个 列表 并 不 完整 。 存 在 无 数 不 同类 型 不 同 用 途 的 元 数据 可 供 编 目 和 管理 。 捕 获 并 维护 元 数据 可 以 更 好 地 记录 数据 库 
和 系统 ， 从 而 使 它们 更 容易 使 用 。 业 务 用户 可 以 使 用 的 元 数据 越 多 ， 他 们 从 信息 系统 中 提取 的 价值 就 越 大 。 


捕获 并 维护 元 数据 使 数据 库 和 系统 更 容易 使 用 。 


22.3 ”资源 库 和 数据 字典 


资源 库存 储 着 企业 数据 资产 的 所 有 信息 。 换 名 话说， 资源 库 用 来 存储 元 数据 。 正 确实 施 的 资源 库存 储 了 公司 所 有 相关 的 元 数 


据 。 它 可 以 作为 一 种 单一 的 、 集 中 的 机 制 ， 协 助 数据 从 多 个 数据 源 迁 移 到 一 个 数据 仓库 。 


° 


资源 库存 储 着 公司 所 有 相关 的 元 数据 。 
选择 资源 库 ， 要 基于 整个 企业 元 数据 存储 的 决策 和 检索 需求 ， 而 不 仅 是 要 支持 的 数据 库 。 通 常 ， 资 源 库 可 以 : 
. 存储 有 关 数 据 、 进 程 和 环境 的 信息 。 
“ 支持 以 多 种 方式 看 待 相同 的 数据 。 一 个 例子 是 三 模式 方法 ， 分 别 从 概念 、 逻 辑 和 物理 层面 对 数据 进行 查看 。 
- 存储 深入 的 文档 ， 并 从 该 文档 产生 细节 和 管理 报告 。 
. 支持 数据 模型 的 创建 和 管理 。 与 流行 的 ETL、 数 据 建 模 和 CASE 工 具 集成 也 是 一 个 重要 的 评价 标准 。 
“ 支持 版 本 和 变更 控制 。 版 本 有 助 于 同步 应 用 程序 开发 ， 消 除 返 工 并 提高 灵活 性 。 
` 强制 命名 约定 。 


“ 解析 并 从 多 个 源 中 提取 元 数据 。 例 如 ， 如 果 代 码 中 大 量 使 用 了 COBOL， 资 源 库 供 应 商 应 该 提供 自动 检查 COBOL 源 代码 并 


提取 元 数据 的 工具 。 
+ 从 数据 元 素 的 定义 中 生成 副本 。 
这 些 都 是 一 些 比较 常见 的 资源 库 功 能 。 在 为 数据 库 开发 选择 资源 库 时 ， 下 面 的 功能 通常 是 可 取 的 : 


资源 库 使 用 的 数据 存储 可 以 使 用 DBMS 的 数据 库 表 。 这 使 得 应 用 程序 可 以 直接 读 取 数 据 字 典 表 。 例 如 ， 如 果 你 主要 使 用 
Oracle， 你 应 使 用 在 Oracle 表 存储 元 数据 信息 的 资源 库 。 有 些 资 源 库 产品 使 用 多 个 DBMS， 并 允许 用 户 选 择 要 使 用 的 DBMS。 


- 资源 库 应 该 能 够 直接 读 取 系 统 目 录 或 每 个 DBMS 系 统 目 录 的 视图 。 这 可 以 确保 资源 库 包 含 数据 库 对 象 当 前 的 信息 。 
. 如 果 资 源 库 不 能 直接 读 取 系 统 目 录 ， 应 提供 一 个 接口 ， 简 化 使 用 系统 目录 信息 填充 资源 库 的 任务 。 
. 资源 库 应 该 为 任何 建 模 和 设计 工具 提供 一 个 接口 ， 用 于 生成 数据 库 对 象 。 


流行 的 资源 库 产品 大 多 是 基于 大 型 机 并 依靠 集中 式 元 数据 “数据 库 ” 或 资源 库 。 这 种 做 法 通常 更 适合 用 于 记录 基于 OLTP 的 
系统 。 这 种 资源 库 在 数据 仓库 环境 中 使 用 可 能 会 更 加 困难 ， 因 为 当 在 一 个 分 布 式 、 先 进 的 数据 仓库 实施 中 管理 元 数据 时 ， 集 中 使 
用 大 型 机 会 存在 一 定 的 挑战 性 。 许 多 在 数据 仓库 项 目 中 使 用 的 ETL 工 具 还 包含 一 个 面向 数据 仓库 需求 的 资源 库 。 需 要 同时 管理 
OLTP 和 数据 仓库 元 数据 的 企业 应 确保 ETL 资 源 库 中 的 数据 可 以 成 功 迁移 到 OLTP 资 源 库 。 


其 他 资源 库 产 品 以 应 用 程序 为 中 心 。 这 样 的 资源 库 技 术 专注 于 应 用 程序 开发 元 数据 ， 有 用 但 不 全 面 。 例 如 ，Microsoft 资 源 
库 专注 于 Visual Studio 并 管理 Microsoft 计 算 资 产 。 


有 些 资源 库 产 品 以 应 用 程序 为 中 心 。 


22.3.1 ”资源 库 的 好 处 


资源 库 技术 为 企业 妥善 利用 自己 的 能 力 提供 了 许多 好 处 。 资 源 库 中 的 元 数据 可 以 用 来 集成 多 个 系统 的 视图 ， 帮 助 开 发 人 员 了 
解 这 些 系统 是 如 何 使 用 数据 的 。 对 使 用 模式 进行 分 析 ， 确 定数 据 是 如 何以 企业 非 正式 理解 的 方式 进行 关联 的 。 友 现 这 样 的 模式 可 
能 会 导致 业务 流程 的 创新 。 


一 般 情 况 下 ， 资 源 库 的 主要 好 处 是 它 提 供 了 记录 数据 元 素 和 业务 规则 的 一 致 性 。 资 源 库 有 助 于 许多 遗留 系统 所 固有 的 “独立 
数据 的 孤岛 ”的 统一 。 通 过 记录 可 以 集成 遗留 系统 与 新 的 应 用 程序 开发 的 程序 和 操作 元 数据 ， 资 源 库 使 企业 认识 到 它们 遗留 系统 
的 价值 。 


资源 库 提供 了 记录 数据 元 素 和 业务 规则 的 一 致 性 。 


此 外 ， 资 源 库 还 可 以 支持 快速 变化 的 环境 ， 如 由 企业 的 互联 网 开发 工作 施加 的 环境 。 检 查 资 源 库 中 的 元 数据 ， 生 成 影响 分 析 
报告 ， 快 速 确定 一 个 区 域 的 变化 会 如 何 影响 其 他 区 域 。 


可 重用 性 可 以 节省 大 量 的 时 间 。 如 果 有 什么 可 以 重复 使 用 而 不 是 从 头 重 新 开发 ， 不 仅 可 以 节省 时 间 ， 而 且 宝 贵 的 资源 可 以 部 
署 在 更 为 关键 的 项 目 上 。 通 过 使 用 应 用 程序 组 件 文档 和 使 企业 使 用 元 数据 可 以 促进 资源 库 的 重复 使 用 。 


最 后 ， 资 源 库 是 对 数据 仓库 项 目的 无 价 援助 。 


22.3.2 ”资源 库 的 挑战 


实施 和 使 用 资源 库 技术 的 最 大 挑战 之 一 是 保持 储存 库 最 新 。 资 源 库 必须 使 用 来 自 多 个 源 的 数据 进行 填充 ， 所 有 这 些 源 在 任何 
时 候 都 可 能 发 生变 更 。 当 源 数 据 的 组 成 或 结构 发 生变 更 时 ， 其 元 数据 也 很 有 可 能 需要 变更 。 


时 刻 保持 资源 库 最 新 可 能 难以 实现 。 


填充 资源 库 的 过 程 很 复杂 ， 应 尽 可 能 实现 自动 化 。 请 参考 图 22-1。 元 数据 的 源 来 自 企业 的 多 个 区 域 和 位 置 ， 可 能 包括 : 
* 应 用 程序 组 件 元 数据 来 自 程序 开发 工具 、 应 用 程序 和 代码 库 。 
“ 业务 元 数据 来 自 业 务 用 户 输 入 、 文 档 和 备忘录 。 
+ 数据 建 模 元 数据 来 自 数 据 建 模 工具 。 
- 数据 库 元 数据 来 自 DBMS 系 统 目录 。 
` 已 TL 元 数据 来 自 数据 仓库 工具 。 
- 操作 元 数据 来 自 自 动 化 操作 和 作业 调度 工具 。 
- 其 他 类 型 的 元 数据 如 数据 使 用 元 数据 来 自 查询 工具 。 


资源 库 的 填充 很 复杂 。 


自动 化 应 用 程序 DBMS 文档 业务 用 
操作 和 调度 开发 人 员工 具 系统 目录 户 输 入 


| 
| 
| 


| 程序 和 
| | REX 


| 
| 


bo 


图 22-1 资源 库 填充 


要 取得 成 功 ， 需 要 对 这 一 信息 进行 收集 、 解 析 并 记录 在 公司 的 元 数据 资源 库 中 。 集 成 过 程 必须 考虑 每 个 元 数据 源 的 变更 频 
率 。 每 当 元 数据 的 源 发 生变 更 时 ， 资 源 库 中 的 元 数据 将 变 得 不 同步 ， 直 到 对 元 数据 源 进 行 扫描 、 捕 获 并 再 次 集成 到 资源 库 。 


许多 公司 并 没有 自己 的 资源 库 。 更 准确 地 说 ， 只 有 很 少 的 公司 拥有 集中 的 元 数据 资源 库 。 此 外 ， 许 多 拥有 资源 库 的 企业 由 于 
不 经 常 实施 适当 的 集成 和 使 用 程序 ， 造 成 资源 库 不 受 重视 。 资 源 库 中 的 元 数据 变 得 过 时 、 不 准确 或 不 存在 ， 资 源 库 将 失去 其 本 身 
的 价值 。 当 然 ， 过 错 并 不 一 定 在 于 资源 库 技 术 ， 更 可 能 在 于 企业 没有 实施 程序 使 资源 库 中 的 元 数据 保持 最 新 。 当 然 ， 这 样 的 工作 
需要 大 量 的 预算 、 承 诺 和 熟练 的 数据 管理 专业 人 员 (包括 DA 和 DBA) 的 努力 。 


只 有 很 少 的 公司 拥有 集中 的 元 数据 资源 库 。 


22.3.3 ”数据 字典 


数据 字典 是 资源 库 技 术 的 前 身 。 数 据 字 典 流 行 于 20 世 纪 80 年 代 。 其 目的 是 管理 数据 定义 。 一 般 情 况 下 ， 它 们 不 提供 自动 
化 ， 用 户 不 得 不 手动 键入 定义 。 在 某 些 情况 下 ， 数 据 字 典 会 集成 到 DBMS， 数 据 库 可 以 使 用 数据 字典 中 的 元 数据 进行 定义 ， 但 这 
是 预 关联 的 〈 在 DBM 产品 之 前 已 经 有 系统 目录 了 ) 。 


数据 字典 的 目的 是 管理 数据 定义 。 


随 着 越 来 越 多 类 型 的 元 数据 的 确定 ， 企 业 希 望 累积 和 管理 这 样 的 元 数据 ， 数 据 字典 转换 为 资源 库 。 使 用 CAsE 工 具 (如 
Excelerator 和 Advantage Gen) 用 于 应 用 程序 和 数据 库 开 发 ， 使 更 多 的 元 数据 能 够 在 开发 过 程 中 捕获 并 维护 。 随 着 开发 人 员 的 
日 益 成 熟 ， 进 化 后 的 数据 字典 不 只 提供 数据 属性 的 描述 。 它 们 还 能 够 跟踪 哪些 应 用 程序 访问 了 哪些 数据 库 。 正 确 使 用 数据 字典 的 
开发 人 员 也 能 够 轻而易举 地 维护 他 们 的 系统 和 应 用 程序 。 


事实 上 ，IBM 的 AD/Cycle 和 Repository Manager 项 目 导 致 了 很 多 这 种 转换 。 即 使 两 个 项 目 在 市 场 上 都 以 失败 告终 ， 资 源 库 
技术 由 于 IBM 这 一 壮举 而 进入 这 一 领域 。 有 关 IBM 项 目 在 这 方面 的 更 多 信息 ， 请 参阅 Henry C.Lefkovits 的 《IBM” s Repository 
Manager/MVS》， 有 关 这 一 主题 的 手册 。 


224 小结 


本 章 是 对 元 数据 管理 的 简单 介绍 。 作 为 一 名 DBA， 你 需要 了 解 元 数据 的 作用 ， 因 为 它 影 响 着 DBMS、 数 据 库 和 数据 库 用 户 。 
花费 大 量 时 间 管 理 和 维护 元 数据 的 企业 可 以 配备 一 名 数据 管理 员 。 同 时 ， 数 据 仓库 管理 员 或 架构 师 也 可 能 专注 于 元 数据 的 管理 。 


DBA 可 能 会 涉及 元 数据 管理 的 某 些 方面 ， 如 资源 库 选 择 、 安 装 和 维护 。 然 而 ， 大 多 数 DBA 使 用 元 数据 远 远 超过 了 存储 、 管 
理 和 维护 元 数据 。 


DBA 使 用 元 数据 远 远 超过 了 存储 、 管 理 和 维护 元 数据 。 


22.5 [allen 


1. 什 么 是 元 数据 ? 

2. 为 什么 说 元 数据 对 于 一 个 企业 很 重要 ? 

3. 在 较 高 层面 上 ， 元 数据 分 为 哪 两 种 类 型 ? 

4 数据 和 信息 之 间 的 区 别 是 什么 ? 

5. 请 描述 资源 库 的 目的 ? 

6. 为 什么 DBA 应 参与 元 数据 管理 策略 的 开发 ， 即 使 在 数据 管理 功能 有 明确 定义 的 企业 ? 
7. 讨 论 成 功 实施 资源 库 的 障碍 。 


8. 为 什么 说 DBMS 系 统 目 录 对 元 数据 分 析 有 用 ? 


9. 什 么 是 数据 主管 ? 


10.DBA 永 远 不 需要 业务 元 数据 ， 而 业务 用 户 永 远 不 需要 技术 元 数据 ， 这 种 说 法 正确 与 否 ? 请 解释 原因 。 
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第 23 章 ”DBA 工 具 


每 一 个 主要 的 DBMS 产 品 都 提供 完整 、 功 能 齐全 的 数据 库 管理 系统 ， 开 箱 即 可 用 来 存储 和 管理 数据 。 虽 然 企业 可 以 安装 并 使 
用 交付 的 DBMS， 但 是 许多 企业 很 快 就 会 发 现 ， 仅 赁 DBMS 产 品 根 本 无 法 提供 充分 支持 大 型 数据 库 开发 所 需 的 功能 。 


如 果 只 使 用 标准 的 DBMS 功 能 ， 那 么 数据 库 应 用 程序 的 管理 和 维护 也 很 耗 时 。 寿 运 的 是 ， 第 三 方 供应 商 提供 了 许多 DBA 工 
具 ， 可 以 用 来 增强 关系 数据 库 管 理 系统 的 功能 。 


23.1 ”DBA 工具 的 类 型 和 好 处 


DBA 工 具 减 少 了 时 间 、 精 力 和 维护 高 效 的 数据 库 系统 和 应 用 程序 所 涉及 的 人 为 错误 。 这 些 工具 减轻 了 管理 负担 ， 并 减少 了 
出 错 的 可 能 性 。 


DBA 工 具 减 少 了 时 间 、 精 力 和 维护 高 效 的 数据 库 系统 所 涉及 的 人 为 错误 。 


只 需 查看 可 用 产品 的 绝对 数目 ， 这 些 工具 的 需求 就 变 得 很 明显 。 大 多 数 企 业 为 它们 的 DBM 至 少 实施 一 种 附加 工具 ， 也 有 许 
多 企业 使 用 几 十 种 ， 目 的 是 减轻 管理 生产 数据 库 开 发 相关 的 管理 负担 。 可 供 使 用 的 工具 品种 众多 ， 填 充 了 主要 DBMS 供 应 商 无 法 
充分 支持 的 市 场 空隙 。 本 章 的 剩余 部 分 简单 介绍 了 可 用 产品 的 种 类 和 类 型 ， 帮 助 DBA 管 理 数据 库 。 


23.1.1 数据 建 异 和 设计 


数据 库 建 模 和 设计 工具 为 创建 概念 和 逻辑 数据 模型 并 将 它们 转换 为 物理 数据 库 设 计 提 供 了 一 整套 一 致 且 连贯 的 方法 。 有 些 数 
据 库 建 模 和 设计 工具 不 会 唯一 地 针对 某 个 特定 的 数据 库 ， 但 有 些 工 具 会 。 专 门 用 于 支持 DBMS 而 开发 的 工具 ， 通 过 将 重复 的 任务 
实现 自动 化 以 及 模型 验证 ， 可 以 显著 减少 开发 的 时 间 。 然 而 ， 如 果 企 业 使 用 了 多 种 DBM 产品， 与 选择 多 个 只 针对 某 个 特定 数据 
库 的 工具 相 比 ， 选 择 一 种 可 以 支持 所 有 产品 的 工具 情况 会 更 好 。 


专门 用 于 支持 DBMS 的 工具 可 以 显著 减少 开发 的 时 间 。 
当选 择 一 种 建 模 和 设计 工具 时 ， 和 寻找 一 种 能 
- 支持 与 远 辑 数据 建 模 相 关 的 标准 任务 ， 如 实体 关系 图 表 和 规范 化 。 


- 创建 物理 数据 模型 ， 针 对 每 一 个 目标 DBMS 平 台 。 该 模型 应 支持 每 一 个 DBMS 的 所 有 功能 。 例 如 ， 大 型 机 上 的 DB2， 它 应 
该 能 够 描绘 出 所 有 的 DB2 对 象 、 参 照 完 整 性 、VCAT ( 卷 目 录 ) 和 STOGROUP 定 义 的 表 空 间 、 系 统管 理 的 存储 和 容量 规划 。 


* 提供 一 个 专家 系统 ， 用 来 验证 物理 数据 模型 的 正确 性 ， 并 建议 替代 性 解决 方案 。 
. 交叉 逻辑 模型 与 物理 模型 ， 捕 提 支 持 物理 设计 定义 的 文本 ， 如 非 规范 化 和 表 空 间 的 类 型 。 


- 自动 生成 标准 的 DDL， 充 分 实现 物理 数据 模型 所 定义 的 数据 库 。 由 工具 根据 物理 模型 创建 的 DDL， 应 该 支持 每 个 DBMS 的 
所 有 选项 。 


:为 企业 使 用 的 应 用 程序 开发 工具 和 资源 库 产 品 提供 接口 。 


23.1.2 ”数据 库 变更 管理 


正如 第 7 章 所 讨论 的 ， 数 据 库 的 变更 是 一 项 艰巨 且 容 易 出 错 的 工作 。 然 而 ， 这 样 的 数据 库 很 罕见 : 在 其 整个 使 用 生命 周期 
中 ， 不 需要 经 过 某 种 变更 。 有 各 种 各 样 的 工具 可 以 帮助 DBA 管 理 和 影响 数据 库 的 变更 。 这 些 工具 可 以 优化 并 自动 化 多 个 变更 管 
理 任务 ， 包 括 数 据 库 修改 、 数 据 库 比较 、 安 全 性 授权 、 审 计 跟 踪 、 目 录 查 询 、 空 间 管 理 和 处 理 参照 完整 性 。 


有 各 种 各 样 的 工具 可 以 帮助 DBA 管 理 和 影响 数据 库 的 变更 。 


变更 管理 工具 的 主要 形式 是 数据 库 修 改 和 比较 工具 。 尽 管 关 系数 据 库 的 结构 可 以 使 用 ALTER 语 句 进行 修改 ， 但 是 这 个 语句 会 
让 大 多 数 DBMSs 产 品 功能 残缺 。 从 理论 上 讲 ，DBA 应 该 可 以 修改 对 象 创建 时 指定 的 所 有 参数 ， 但 目前 没有 DBM 产品 支持 这 么 
做 。 例 如 ， 大 多 数 DBMSs 产 品 允 许 向 一 个 存在 的 表 中 添加 列 ， 但 只 在 表 的 最 后 。 此 外 ， 它 们 不 允许 DBA 删 除 表 的 列 (必须 删除 
表 ， 然 后 重新 创建 不 包含 指定 列 的 新 表 ) 。 


ALTER 语 名 会 让 大 多 数 DBMS 产 品 的 功能 残缺 。 


DBA 在 修改 数据 库 结 构 时 会 遇 到 的 另 一 个 问题 是 级 联 式 DROP 效 应 。 如 果 某 个 数据 库 对 象 的 变更 命令 删除 并 重建 该 对 象 ， 那 
么 当 删 除 该 数据 库 对 象 时 ， 所 有 相关 的 对 象 都 会 删除 。 这 包括 表 、 表 的 所 有 索引 、 所 有 的 主 码 和 外 码 、 任 何 相关 的 同义词 和 视 
图 、 任 何 触 发 器 、 所 有 的 授权 和 数据 。 在 修改 后 确保 发 出 DDL 来 逆转 级 联 式 DROP 所 产生 的 影响 ， 可 能 是 一 个 烦琐 、 复 杂 且 容易 
出 错 的 过 程 。 


多 种 数据 库 对 象 的 变更 都 不 能 使 用 通用 的 ALTER 语 句 。 

另外 ， 许 多 其 他 类 型 的 数据 库 对 象 的 变更 都 不 能 使 用 通用 的 ALTER 语 句 。 根 据 不 同 的 DBMS， 你 也 许 不 能 : 
. 变更 数据 库 、 表 、 别 名 、 视 图 、 列 、 表 空间 、 数 据 库 空间 、 和 触发 器 、 存 储 过 程 、 用 户 自 定 义 函数 、 关 联 或 索引 的 名 称 。 
变更 数据 库 分 区 。 

* 将 表 从 一 个 数据 库 、 数 据 库 空间 或 表 空间 转移 到 另 一 个 数据 库 、 数 据 库 空间 或 表 空 间 。 

“ 重新 安排 列 的 顺序 。 

变更 某 列 的 数据 类 型 和 长 度 。 

- 删除 表 的 列 。 

. 变更 主 码 ， 而 不 是 删除 和 添加 主 码 。 

. 向 视图 添加 列 ， 或 从 视图 删除 列 。 

. 变更 某 个 视图 基于 的 SELECT 语句 。 

变更 索引 列 。 

- 变更 索引 的 唯一 性 说 明 。 

. 变更 索引 或 表 的 集群 。 

确保 数据 库 变更 能 够 正确 进行 的 重担 就 从 DBA 转 移 到 工具 。 


通常 ， 这 样 的 列表 提供 了 获得 一 种 数据 库 变更 工具 所 需 的 所 有 理由 。 当 然 ， 列 表 会 因 DBMS 不 同 而 有 所 不 同 。 数 据 库 变更 工 
具 为 变更 数据 库 对 象 提供 了 一 个 集成 环境 。 这 样 的 工具 通常 都 会 提供 一 个 菜单 驱动 或 单 击 式 接 口 ， 允 许 DBA 指 定 所 需 的 变更 类 
型 。 因 此 ， 确 保 数 据 库 变更 能 够 正确 进行 的 重担 就 从 DBA 转 移 到 工具 。ALTER 工 具 至 少 应 : 


. 不 需要 DBA 手 动 编写 DDL， 就 可 以 轻松 地 维护 表 。 

:如果 需 要 删除 ， 那 么 应 该 保留 或 重新 应 用 所 有 受 ALITER 影 响 的 相关 对 象 、 授 权 和 数据 。 
“ 逐个 对 象 分 层 导 航 。 

- 提供 基于 GUI 的 修改 ， 在 变更 应 用 前 显示 对 象 定义 的 “前 ”和 “后 ” 

将 批 处 理 请 求 的 变更 分 组 ， 既 可 以 在 前 台 执 行 ， 又 可 以 在 后 台 执 行 。 


对 变更 进行 分 析 ， 确 保 所 请 求 的 变更 不 会 违背 任何 DDL 规 则 。 例 如 ， 如 果 有 一 系列 的 变更 请 求 ， 而 一 个 变更 导致 了 随后 


的 变更 无 效 ( 例 如， 删除 一 个 对 象 ) ， 这 应 该 在 执行 前 就 进行 标示 。 
" 有 能 力 对 变更 应 用 进行 监测 。 


自动 化 的 变更 管理 解决 方案 使 DBA 能 够 将 注意 力 放 在 必需 的 变更 上 ， 而 不 是 DBMS 如 何 实施 这 些 变更 的 琐碎 细节 上 。 该 工具 
的 建立 不 仅 要 了 解 变 更 管理 规则 ， 还 要 了 解 进行 变更 的 DBMS。 典 入 的 智能 将 确保 数据 库 对 象 的 变更 不 会 将 其 他 隐 式 变更 的 重担 
从 DBA 切 换 到 工具 。 此 外 ， 变 更 一 旦 确定 并 在 一 个 系统 实施 ， 再 将 它 稍 作 或 不 作 修 改 部 署 到 其 他 数据 库 副 本 就 相当 容易 。 


变更 管理 工具 的 另 一 个 好 处 在 于 数据 库 分 析 和 规划 。 实 施 任何 变更 之 前 ， 都 可 以 对 变更 可 能 产生 的 影响 进行 研究 。 这 是 确保 
安全 有 效 的 数据 库 变更 的 宝贵 资源 。 这 种 类 型 的 工具 也 使 用 自动 化 来 最 大 程度 地 减少 实施 数据 库 变更 所 需 的 资源 。 没 有 必要 为 每 
个 数据 库 变更 从 头 编写 新 的 、 复 杂 的 变更 脚本 ，DBA 完 全 可 以 凭借 变更 管理 工具 做 到 这 一 点 。 应 用 程序 和 数据 库 的 可 用 性 也 将 
得 到 提升 ， 因 为 产品 会 尽 可 能 以 一 种 最 快 且 影响 最 小 的 方式 实施 变更 。 


实施 任何 变更 之 前 ， 都 可 以 对 变更 可 能 产生 的 影响 进行 研究 。 


总 之 ， 数 据 库 变更 管理 产品 可 以 提升 可 用 性 ， 最 大 程度 地 减少 错误 ， 并 加 快 上 市 的 时 间 。 


数据 库 比 较 工具 


随 着 时 间 的 推移 ，DBA 将 在 整个 企业 范围 内 进行 数据 库 的 变更 。 届 时 ， 即 使 使 用 自动 化 的 数据 库 变更 管理 解决 方案 ， 一 些 
变更 可 能 只 在 某 些 系 统 上 实施 ， 而 一 些 系 统 则 不 能 实施 。 大 型 公司 的 DBA 必 须 跟踪 几 十 个 (如 果 不 是 成 百 上 干 ) 数据 库 服务 
器 ， 因 此 ， 确 保 变 更 可 以 有 效 迁 移 到 所 有 这 些 数 据 库 服务 器 上 是 一 项 相当 有 难度 的 任务 。 


确保 变更 可 以 有 效 迁 移 是 一 项 相当 有 难度 的 任务 。 


数据 库 比 较 工 具 使 DBA 能 对 不 同 数据 库 的 对 象 和 结构 进行 对 比 。 这 样 的 工具 可 以 确定 它们 之 间 的 区 别 并 自动 生成 DDL， 从 
而 使 数据 库 变 成 一 样 (从 结构 的 角度 来 看 ， 而 不 是 数据 内 容 角 度 ) 。 数 据 库 比较 工具 应 该 允许 DBA 进 行 下 面 几 种 类 型 的 比较 : 


一 个 活动 数据 库 与 另 一 个 活动 数据 库 (同一 个 服务 器 或 不 同 的 服务 器 ) 。 
一 个 活动 数据 库 与 一 个 DDL 脚 本 文件 。 
- 一 个 DDL 脚 本 文件 与 另 一 个 DDL 脚 本 文件 。 


管理 大 量 数据 库 服 务 器 的 DBA 应 该 考虑 使 用 这 样 的 产品 。 就 像 之 前 提 到 的 ， 数 据 库 比较 工具 只 比较 数据 库 的 结构 ， 而 不 比 
较 内 容 。 但 是 ， 有 些 供应 商 提 供 的 工具 可 以 对 一 个 表 的 内 容 与 男 一 个 表 的 内 容 进行 比较 。 这 样 的 工具 往往 能 在 应 用 程序 的 测试 和 
调试 过 程 派 上 用 场 。 


数据 库 对 象 迁移 工具 


许多 DBMS 产 品 并 不 提供 在 数据 库 服务 器 或 子 系统 之 间 迁 移 数据 库 对 象 的 功能 。 不 使 用 工具 ， 要 实现 这 个 功能 就 只 能 手动 将 
DDL CREATE 语 句 (以 及 所 有 随后 的 ALTER 语 句 ) 存储 在 一 个 脚本 文件 中 ， 然 后 在 另 一 个 数据 库 服务 器 上 运行 该 脚本 。 然 
后 ，DBA 需 要 从 源 系统 卸载 数据 ， 并 在 目标 系统 重新 加 载 数据 (如 果 数 据 连 同 数据 库 模式 一 起 迁移 ) 。 这 样 的 手动 过 程 很 容易 
出 错 。 此 外 ， 表 数据 和 数据 库 安 全 的 迁移 不 会 考虑 这 种 过 程 。 


迁移 工具 为 数据 库 对 象 从 一 个 环境 到 另 一 个 环境 (例如 ， 从 测试 环境 到 生产 环境 ) 的 快速 迁移 提供 了 便利 。 尽 管 与 表 改 变 工 
具 类 似 ， 对 象 迁移 工具 具有 最 小 的 改变 能 力 ( 某 些 接口 直接 与 ALTER 工 具 连 接 或 集成 到 一 个 单一 的 工具 ) 。 迁 移 程 序 由 提示 用 户 
要 迁移 哪些 对 象 的 面板 或 GUI 屏幕 驱动 。 


迁移 工具 为 数据 库 对 象 的 快速 迁移 提供 了 便利 。 


通常 可 以 指定 任何 级 别 的 迁移 。 例 如 ， 如 果 你 请 求 某 个 特定 数据 库 的 迁移 ， 也 可 以 迁移 所 有 与 之 相关 的 对 象 和 安全 。 有 了 这 
种 能 力 ， 数 据 库 对 象 的 名 称 、 授 权 ID 和 其 他 对 象 都 可 以 根据 接收 实例 、 子 系统 或 服务 器 的 标准 进行 重 命名 。 当 迁移 的 参数 完全 
指定 时 ， 工 具 就 会 创建 一 个 作业 ， 用 于 在 所 请 求 的 环境 实施 所 请 求 的 数据 库 对 象 。 


迁移 工具 可 以 减少 数据 库 管 理 员 在 不 同 的 环境 之 间 移 动 数据 库 所 需 的 时 间 。 更 快 的 周转 导致 更 快速 地 响应 用 户 的 需求 ， 从 而 
增加 了 业务 效率 。 


参照 完整 性 工具 


:分析 系统 和 用 户 管理 的 数据 的 参照 完整 性 约束 违反 。 
` 比 DBMS 提 供 的 完整 性 检查 工具 或 实用 程序 运行 速度 更 快 。 


- 支持 其 他 类 型 的 RI， 例 如 ， 通 过 分 析 不 存在 外 码 的 主 码 ， 并 将 主 码 行 删除 ( 垂 悬 式 DELETE 处 理 ) 。 


此 外 ， 可 用 的 工具 人 允许 在 参照 集中 查看 数据 并 对 数据 进行 提取 。 有 了 这 种 能 力 ， 使 用 生产 数据 库 中 一 部 分 数据 来 创建 合理 的 
测试 数据 就 变 得 更 加 容易 。 


目录 查询 和 分 析 工 具 


系统 目录 或 数据 字典 中 包含 丰富 的 信息 ， 对 DBMS 的 操作 至 关 重 要 。 所 有 有 关 数 据 库 对 象 、 权 限 和 恢复 的 信息 都 存储 在 系统 
目录 中 ， 维 护 也 在 其 中 。DBA 依 靠 这 些 信 息 来 执行 他 们 的 工作 。 系 统 目录 由 关系 表 组 成 ， 可 以 使 用 SQL 和 /或 供应 商 提供 的 存储 
过 程 进行 查询 。 有 些 DBMS 供 应 商 还 提供 更 容易 查询 和 监测 的 系统 目录 视图 。 然 而 ， 当 访问 系统 目录 时 ， 其 中 的 表 只 为 监测 和 管 
理 任 务 提 供 一 个 信息 库 。 


DBA 依 靠 系统 目录 来 执行 他 们 的 工作 。 


每 次 进行 SQL 编码 时 ，DBA 都 需要 访问 系统 目录 中 的 信息 ， 这 个 过 程 非常 耗 时 。 通 常情 况 下 ，DBA 必 须 将 多 个 目录 表 中 的 信 
息 结合 起 来 ， 为 用 户 提供 特定 任务 相关 的 事实 。 此 外 ， 在 大 多 数 情 况 下 ， 由 于 DBMS 供 应 商 使 用 奇怪 的 命名 约定 、 非 规范 化 的 结 
、 未 使 用 的 列 、 糟 糕 的 数据 类 型 选择 和 缺乏 文档 ， 目 录 表 很 难 理解 和 查询 。DBM Ss 供应 商 向 他 们 产品 的 新 版 本 添加 了 新 的 功 
6， 系 统 目录 变 得 越 来 越 难 理解 ， 因 为 新 的 数据 强制 添加 到 原本 已 经 非常 综 乱 的 系统 目录 设计 和 实施 中 。 如 果 提 供 存储 过 程 和 视 
， 那 么 目录 表 的 查询 就 比较 简单 。 但 是 ， 这 些 定制 好 的 查询 有 时 会 缺少 某 些 重要 信息 。 


a St 


区 


附加 的 查询 工具 可 以 减轻 开发 那些 用 于 访问 系统 目录 表 的 SQ 查询 的 重担 。 有 时 这 些 工具 称 作 目 录 可 视 性 工具 ， 因 为 它们 使 
得 访问 存储 在 系统 目录 中 的 信息 更 加 容易 。 所 有 目录 工具 共同 的 基本 特征 是 它们 都 能 够 使 用 GUI 接 口 而 不 是 SQL 语 句 来 请 求 目录 
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GUI 是 所 有 目录 工具 共同 的 基本 特征 。 


仅 提 供 这 种 能 力 的 系统 目录 工具 最 多 算是 初级 工具 。 有 许多 工具 可 以 提供 更 多 的 功能 。 除 了 数据 访问 ， 许 多 工具 还 可 以 执行 
一 种 或 多 种 下 面 的 任务 : 


通过 读 取 相应 的 系统 目录 表 ， 为 所 有 数据 库 对 象 创建 语法 正确 的 DDL 语 和 句 。 这 些 语句 通常 立即 运行 或 者 存储 在 一 个 数据 


集中 ， 供 将 来 参考 或 使 用 。 
- 使 用 非 SQL 接 口 修 改 任 何 可 更 新 的 统计 列 。 
. 使 用 生成 DDL 同 样 的 方式 ， 在 目录 中 创建 语法 正确 的 授权 /安全 语句 。 


- 在 SQL DROP 语 句 中 执行 “下 降 分 析 ”， 这 种 分 析 通 过 详 述 由 于 运行 DROP 而 删除 的 所 有 对 象 和 安全 ， 来 确定 级 联 式 
DROP 所 产生 的 影响 。 


* 提供 数据 库 对 象 的 层次 结构 列表 。 例 如 ， 如 果 选 择 了 一 个 特定 的 表 ， 该 工具 可 以 迅速 沿 层次 结构 向 上 迁移 ， 来 显示 它 的 表 
空间 和 数据 库 ; 或 者 沿 着 层次 结构 向 下 依次 显示 所 有 相关 的 索引 、 视 图 、 同 义 词 、 别 名 、 引 用 连接 表 和 规划 。 


.CREATE 和 DROP 数 据 库 对 象 ， 不 需要 SQL 编码 ， 从 某 个 屏幕 就 可 以 授予 和 撤销 安全 。 此 外 ， 一 些 工 具 记 录 了 所 有 的 
DROP 和 REVOKE ， 以 至 于 在 无 意 执行 DROP 或 REVOKE 的 情况 下 ， 可 以 撤销 这 些 操作 。 


. 直接 在 系统 目录 或 其 副本 上 进行 操作 ， 减 少 全 系统 争 用 。 
“ 生成 一 整套 用 于 管理 数据 库 的 数据 库 命令 。 例如， 启动 /停止 数据 库 或 表 空 间 、 显 示 系 统 信息 和 其 他 命令 。 


这 些 功 能 有 助 于 DBA 执 行 他 们 的 日 常 工作 。 此 外 ， 目 录 查 询 工 具 可 以 大 幅 减 少 一 个 初级 DBA (或 新 的 工作 人 员 ) 成 为 对 
DBA 团 队 有 贡献 的 成 员 所 需 的 时 间 量 。 


23.1.3” 表 编辑 器 


大 多 数 DBMS 产 品 开 箱 只 提供 两 种 更 新 关系 数据 的 方法 : 
- SQL DELETE、INSERT 和 UPDATE 语 身 。 
- 数据 库 实用 程序 ， 如 LOAD 或 IMPORT。 


SQL 语句 一 次 可 以 操作 一 组 数据 ， 因 此 单个 SQL 语句 可 以 影响 多 行 ， 甚 至 所 有 的 行 。 在 应 用 程序 开发 和 测试 阶段 为 所 有 数据 
修改 编写 SQL 语句 是 很 费时 的 。 此 外 ， 数 据 库 实 用 程序 如 LOAD 和 IMPORT 对 于 较 小 针对 性 的 数据 变更 并 不 切实 可 行 。 它 们 的 设 
计 和 优化 是 为 了 大 批量 的 数据 移动 。 


表 编 辑 工具 可 以 减少 为 数据 库 表 提供 全 屏幕 编辑 功能 而 进行 简单 的 数据 修改 所 需 的 时 间 。 用 户 指定 要 编辑 的 表 ， 然 后 表 编 辑 
器 打开 。 数 据 以 一 系列 行 的 形式 呈献 给 用 户 ， 列 之 间 由 空格 分 开 。 标 题 行 表示 列 的 名 称 。 数 据 可 以 向 上 或 向 下 滚动 ， 也 可 以 向 左 
或 向 右 滚动 。 用 户 要 变更 数据 ， 只 需 在 当前 数据 上 键入 新 的 数据 。 


表 编 辑 工具 可 以 减少 进行 简单 的 数据 修改 所 需 的 时 间 。 


这 种 类 型 的 工具 是 支持 应 用 程序 开发 过 程 的 理想 选择 。 程 序 员 可 以 快速 进行 变更 ， 无 需 SQL 编 码 。 此 外 ， 如 果实 施 得 当 ， 表 
编辑 器 还 可 以 减少 初级 SQL 用 户 进行 错误 的 数据 修改 的 次 数 。 


对 关键 的 生产 数据 使 用 表 编辑 器 要 格外 小 心 。 当 使 用 表 编 辑 器 时 ， 所 有 的 列 都 可 以 更 新 ， 一 个 简单 的 错误 输入 可 能 会 导致 不 
必要 的 更 新 。 如 果 你 必须 要 确保 只 更 新 某 些 特定 的 列 ， 应 使 用 原生 SQL。 经 过 测试 的 SQL 语句 和 应 用 程序 的 特点 是 它们 都 具备 计 
划 的 本 质 : 修改 请 求 都 经 过 深思 熟 虑 和 测试 。 通 过 表 编辑 器 实施 变更 不 是 这 样 的 。 


23.1.4 性 能 管理 
确保 最 佳 的 性 能 是 DBA 一 直面 临 的 最 大 问题 之 一 。 用 户 最 大 的 不 满意 是 他 们 等 待 应 用 程序 响应 的 时 间 比 以 前 更 长 了 。 如 果 
用 户 在 过 去 不 需要 等 待 ， 情 况 尤其 如 此 。 


然而 ， 是 什么 导致 这 些 原 本 很 快 的 应 用 程序 停止 并 提供 从 佳 的 性 能 ”如 果 这 个 问题 有 一 个 简单 的 答案 ， 那 么 相信 许多 DBA 
将 失去 工作 。 性 能 管理 工具 可 以 帮助 DBA 衡 量 SQL 查 询 、 数 据 库 结构 和 系统 参数 的 效果 与 效率 。 这 些 工 具 在 后 台 运 行 ， 捕 捉 数 据 
库 的 性 能 统计 数据 ， 当 问题 发 生 时 提醒 DBA。 更 为 先进 的 性 能 工具 可 以 采取 积极 主动 的 措施 ， 在 问题 发 生 时 纠正 它们 。 


每 一 个 数据 库 应 用 程序 (其 核心 ) 都 需要 操作 三 个 组 件 : 系统 、 数 据 库 和 应 用 程序 。 为 了 提供 性 能 ，DBA 必 须 能 够 对 每 个 
组 件 进行 监测 和 调整 。 有 一 些 工 具 可 供 DBA 监 测 和 优化 这 些 组 件 。 


为 了 提供 性 能 ，DBA 必 须 能 够 对 系统 、 数 据 库 和 应 用 程序 进行 监测 。 


系统 性 能 工具 


系统 性 能 工具 对 数据 库 服务 器 及 其 配置 和 使 用 进行 检查 。 最 常见 的 系统 性 能 工具 是 性 能 监视 器 。 数 据 库 性 能 监测 和 分 析 工 具 
以 多 种 方式 支持 多 种 类 型 的 面向 性 能 的 请 求 。 例 如 ， 系 统 性 能 工具 的 操作 可 以 : 


:以 后 台 模式 作为 批 处 理 作 业 ， 报 告 由 DBMS 跟 踪 设备 所 写 的 统计 数据 。 

以 前 台 模 式 作 为 在 线 的 监视 器 ， 要 么 设 陷 阱 跟踪 信息 ， 要 么 从 作为 应 用 程序 执行 的 DBMS 控 制 块 中 捕 提 信息 。 
当 程 序 运行 时 ， 对 数据 库 内 核 和 用 户 地 址 空间 进行 取样 ， 并 捕捉 有 关 作 业 、 独 立 数 据 库 跟踪 的 信息 。 

“ 捕捉 数据 库 跟踪 信息 并 在 历史 文件 (或 表 ) 中 对 其 进行 维护 ， 用 于 生成 历史 性 能 报告 并 预测 性 能 趋势 。 

* 作为 容量 规划 设备 ， 给 出 应 用 程序 及 其 所 在 环境 的 统计 信息 。 

: 作为 工作 站 的 事后 分 析 工 具 ， 对 应 用 程序 性 能 和 全 系统 性 能 的 各 个 方面 进行 分 析 并 生成 图 表 。 


每 个 数据 库 性 能 监视 器 都 支持 一 种 或 多 种 这 些 功能 。 数 据 库 性 能 监视 器 的 评估 是 一 项 复杂 的 工作 。 有 时 一 家 公司 不 止 使 用 一 
个 性 能 监视 器 ， 或 许 一 个 用 于 批 处 理 报告 ， 而 另 一 个 用 于 在 线 事 件 监 测 。 也 许 已 经 实施 了 企业 范围 的 监测 解决 方案 ， 该 解决 方案 
的 一 个 组 件 是 用 于 监测 DBMS 的 一 个 数据 库 模 块 ， 但 是 这 种 方案 缺乏 更 复杂 的 DBMS 监 视 器 可 以 提供 的 细节 。 因 此 ， 购 买 男 一 种 
性 能 监视 器 供 DBA 日 常 使 用 ， 而 企业 学 围 的 监测 解决 方案 的 模块 由 系统 管理 员 用 于 集成 监测 。 


现代 数据 库 性 能 工具 都 可 以 设置 性 能 阔 值 ， 一 旦 达到 ， 将 不 断 提 醒 DBA， 直 到 问题 解决 。 这 些 工具 通常 都 是 基于 代理 的 。 
代理 是 一 段 独立 的 代码 ， 在 服务 器 上 运行 并 寻找 问题 。 它 与 运行 在 另 一 台 机 器 (由 DBA 查 看 ) 上 的 控制 台 相互 作 用 ， 但 不 依赖 
对 方 。 这 种 代理 架构 使 数据 库 监测 非常 高 效 ， 因 为 代理 不 绑 定 工作 站 ， 它 可 以 独立 运行 。 代 理 仅 在 需要 时 会 给 DBA 发 送信 息 。 


此 外 ， 一些 可 用 的 系统 性 能 工具 专注 于 DBMS 的 某 个 特定 组 件 ， 如 数据 高 速 缓存 。 这 样 的 工具 可 以 用 来 模拟 数据 库 绥 存 的 内 
存 需 求 ， 捕 捉 数 据 缓存 利用 率 的 统计 信息 ， 甚 至 可 以 提出 建议 提高 数据 缓存 的 性 能 。 


一 些 系 统 性 能 工具 专注 于 DBMS 的 某 个 特定 组 件 ， 如 数据 高 速 缓存 。 


另 一 种 性 能 优化 工具 ， 不 需要 回收 DBMS 实 例 、 子 系统 或 服务 器 ， 就 可 以 对 数据 库 配 置 参 数 进行 变更 。 当 变更 需要 DBMS 停 


止 并 重新 启动 时 ， 这 些 工具 非常 有 用 。 它 们 可 以 极 大 地 提高 可 用 性 ， 特 别 是 如 果 配 置 参数 经 常 需要 变更 而 DBM 不 支持 动态 参数 
修改 。 


一 些 ISV 提 供 了 侵入 式 系统 性 能 工具 ， 通 过 直接 向 DBMS 添 加 功能 并 与 数据 库 内 核 交 互 来 提高 数据 库 的 性 能 。 通 常情 况 下 ， 


例如 ， 可 以 提高 数据 库 页 面 或 块 的 读 取 性 能 的 产品 ， 或 通过 对 缓冲 区 及 其 处 理 提供 额外 的 存储 和 控制 权 来 优化 数据 缓存 的 产 
品 。 对 侵入 式 性 能 工具 进行 评估 时 一 定 要 小 心 。DBMS 的 新 版 本 可 能 会 消除 对 这 些 工具 的 需求 ， 因 为 添加 了 新 的 功能 或 者 对 已 知 
的 缺点 进行 了 纠正 。 但 这 并 不 意味 着 你 不 应 该 考虑 侵入 式 数 据 库 性 能 工具 。 在 很 短 的 一 段 时 间 之 后 ， 你 就 会 看 到 回报 。 在 DBMS 
可 以 替代 工具 时 放弃 使 用 工具 完全 没有 问题 ， 前 提 是 该 工具 已 经 为 你 带 来 更 好 的 性 能 回报 。 


对 侵入 式 性 能 工具 进行 评估 时 一 定 要 小 心 。 

最 后 需要 注意 的 是 : 因为 侵入 式 性 能 工具 可 以 非常 紧密 地 与 数据 库 内 核 进行 交互 ， 在 更 新 DBMS 版 本 或 工具 版 本 时 一 定 要 很 
小 心 。 由 于 这 些 工具 的 侵入 性 ， 应 该 对 它们 进行 额外 的 测试 。 
数据 库 性 能 工具 


大 多 数 DBMS 不 提供 智能 数据 库 分 析 能 力 。 相 反 ，DBA 或 性 能 分 析 师 必须 使 用 系统 目录 视图 和 查询 (或 者 系统 目录 工具 ) 持 
续 关注 每 个 数据 库 及 其 对 象 。 但 这 并 不 是 最 佳 的 解决 方案 ， 因 为 它 依靠 对 高 效 的 数据 库 企业 的 人 为 干涉 ， 从 而 增加 了 人 为 错误 的 
可 能 性 。 


幸运 的 是 ， 数 据 库 分 析 工 具 可 以 非常 前 瞻 地 、 自 动 地 对 数据 库 环境 进行 监测 。 这 些 数据 库 分 析 工 具 通 常 可 以 : 
* 收集 表 和 索引 的 统计 信息 : 标准 的 统计 信息 、 捕 捉 更 多 信息 的 扩展 统计 信息 (例如 ， 数 据 集 的 范围 ， 或 两 者 的 组 合 。 


- 读 取 数据 库 对 象 的 底层 数据 集 来 捕捉 当前 的 统计 信息 ， 从 系统 目录 读 取 数据 库 统 计 信息 ， 读 取 工 具 专 有 的 表 ， 捕 捉 增强 的 
统计 信息 ， 或 其 任意 组 合 。 


“ 基于 数据 库 统 计 信 息 设置 阅 值 ， 从 而 可 以 调用 数据 库 重组 的 自动 调度 和 其 他 维护 任务 。 


.提供 一 系列 的 国定 报告 ， 详 述 特定 数据 库 对 象 的 潜在 问题 。 
应 用 程序 性 能 工具 


编写 SQL 语句 来 访问 数据 库 表 是 应 用 开发 团队 的 责任 。 然 而 ， 当 涉及 SQL 的 性 能 时 ，DBA 通 常会 介入 。 由 于 SQL 的 灵活 性 ， 
同样 的 请 求 的 方式 有 好 多 种 。 因 为 这 些 方式 中 有 很 多 效率 很 低 ， 如 果 在 实施 前 专家 不 对 SQL 进行 分 析 和 调整 ， 应 用 程序 的 性 能 将 
大 打折 扣 。 
应 用 程序 性 能 的 重要 性 
多 达 80% 的 数据 库 性 能 问题 是 低 效 的 SQL 和 应 用 程序 代码 引起 的 。 
EXPLAIN 或 SHOWPLAN 命 令 通过 解析 应 用 程序 中 的 SQL 并 将 编码 输出 放 到 一 个 PLAN_TABLE 中 ， 或 者 生成 一 个 标准 访问 路 


径 的 报告 ， 来 提供 SQL 查询 所 使 用 的 访问 路 径 。 要 衡量 其 效率 ，DBA 必 须 对 这 些 数 据 进 行 解码 ， 并 确定 是 否 存 在 更 加 有 效 的 访问 
路 径 。 


要 确保 使 用 了 最 佳 的 SQL 设计 技术 ，SQL 代 码 审查 是 必需 的 。 正 如 第 6 章 所 讨论 的 ， 应 该 通过 应 用 程序 审查 对 所 有 的 SQL 语 
句 、 选 择 的 访问 路 径 和 SQL 内 蔡 的 程序 代码 执行 一 次 审查 。 该 审查 还 包括 对 数据 库 统 计 信息 的 评估 ， 以 确定 EXPLAN 是 否 使 用 了 


生产 级 别 的 统计 信息 。 


应 用 程序 源 代码 的 逐 行 审 查 和 EXPLAIN 输 出 都 过 于 烦琐 上 且 容易 出 错 ， 并 且 可 能 会 导致 应 用 程序 的 积压 。SQL 分 析 工 具 通 过 将 
代码 审查 过 程 的 主要 部 分 自动 化 ， 大 大 简化 这 一 过 程 。SQL 分 析 工 具 通 常 : 


SQL 分 析 工 具 可 以 将 代码 审查 过 程 的 主要 部 分 自动 化 。 

:分析 应 用 程序 中 的 SQL， 并 以 图 表 的 形式 、 英 语 描述 或 二 者 相 结合 的 形式 描述 所 选择 的 访问 路 径 。 

` 遇 到 特定 的 SQL 结构 时 发 出 警告 。 例 如 ， 每 一 次 请 求 排 序 (通过 ORDER BY, GROUP BY 或 DISTINCT) ， 都 会 通过 消息 
将 排序 方法 告知 用 户 。 

- 基于 可 以 用 来 读 取 SQL 语 句 及 其 相应 的 PLAN_TABLE 条 目的 “专家 系统 ”给 出 替代 的 SQL 解决 方案 的 建议 ， 并 形成 替代 的 
SQL 选项 。 

. 扩展 “专家 系统 ”使 用 的 规则 ， 捕 提 站 点 特定 的 规则 。 

: 对 子 系统 、 实 例 、 服 务 器 、 应 用 程序 、 规 划 、 数 据 包 或 SQL 语句 的 级 别 进行 分 析 。 


“ 存储 多 个 版 本 的 EXPLAIN 输 出 ， 创 建 性 能 比较 ， 并 计划 历史 报告 。 


工具 也 可 以 对 SQL 所 在 的 应 用 程序 代码 的 性 能 进行 分 析 。 这 些 工 具 往 往 可 以 在 程序 运行 时 捕捉 程序 的 深层 信息 ， 并 提供 报告 
指出 哪些 代码 区 域 消耗 的 资源 最 多 。 踪 憾 的 是 ， 这 些 工具 中 大 多 数 不 一 定 与 SQL 分 析 工 具 兼 容 。 如 果 你 对 这 个 间 题 感 兴趣 ， 请 参 
阅 “ 应 用 程序 和 SQL 分 析 ”。 


SQL 分 析 工 具 所 需 的 首要 功能 是 能 够 读 取 并 解释 标准 的 EXPLAIN 或 SHOWPLAN 输 出 。 该 工具 应 该 可 以 读 取 计 划 表 ， 或 直接 
与 DBMS 命 令 交互 来 获得 输出 。 然 后 ， 它 必须 能 够 自动 扫描 EXPLAIN 或 SHOWPLAN 数 据 ， 并 报告 所 选择 的 访问 路 径 和 预测 的 性 
能 。 通 过 添加 索引 或 修改 SQL， 更 为 先进 的 工具 还 可 以 为 SQL 的 改进 提供 建议 。 


应 用 程序 和 SQL 分 析 


假设 一 个 应 用 程序 ， 其 中 的 一 个 循环 中 包含 一 个 单独 的 SELECT。 这 个 单独 的 SELECT 在 WHERE 子 句 的 基础 上 请 求 单个 行 、 
检查 表 的 主 码 。 对 于 该 循环 中 的 每 一 个 选 代 ， 程 序 都 会 改变 其 搜索 到 的 主 码 的 值 ， 以 至 于 整个 表 的 读 取 是 从 最 低 的 码 值 到 最 高 的 
码 值 。 


SQL 分 析 工 具 可 能 不 会 将 SQL 语句 视 作 低 效 ， 因 为 谓词 值 针 对 主 码 ， 主 码 来 调用 索引 访问 。 应 用 程序 分 析 工 具 可 能 会 将 访问 
数据 的 代码 部 分 标记 为 低 效 ， 但 它 不 会 帮 你 修改 问题 ， 也 不 会 告诉 你 为 什么 它 是 低 效 的 。 


有 经 验 的 性 能 分 析 师 或 DBA 必 须 同 时 使 用 这 两 种 工具 并 对 每 个 工具 的 输出 进行 解释 ， 才 能 达到 令 人 满意 的 结果 。 例 如 ， 编 
写 光 标的 代码 (不 使 用 谓词 ) 检索 表 的 每 一 行 ， 然 后 逐 行 获取 每 一 行 。 这 种 方法 会 消除 索引 IO ， 可 以 使 用 并 行 访问 ， 因 此 应 该 
会 减少 I/O 和 经 过 的 时 间 ， 从 而 提升 性 能 。 


只 有 受过 训练 的 分 析 师 才 可 能 在 代码 走 查 过 程 中 发 现 这 种 设计 问题 。 尽 管 计划 分 析 工 具 可 以 大 大 降低 代码 审查 过 程 所 付出 的 
努力 ， 但 并 不 能 消除 问题 。 


端 到 端的 性 能 工具 


现代 应 用 程序 交付 功能 需要 多 个 系统 组 件 并 且 跨 多 个 联网 的 设备 运行 。 性 能 问题 出 现时 ， 很 难 确定 究竟 是 什么 原因 。 在 客户 
端 还 是 服务 器 端 ” 网 络 问题 ”数据 库 问 题 或 代码 问题 ? 


端 到 端的 性 能 监测 工具 的 存在 ， 从 始 到 终 跟踪 应 用 程序 的 请 求 。 这 些 解决 方案 可 以 明确 为 应 用 程序 性 能 提供 增强 的 可 视 性 ， 
帮助 企业 了 解 何 时 以 及 为 什么 性 能 降低 了 ， 以 及 提高 业务 优先 级 的 时 尚 事宜 所 需 的 信息 。 


端 到 端的 性 能 监测 工具 从 始 到 终 跟 踪 应 用 程序 的 请 求 。 


随 着 工具 跨越 一 个 个 硬件 和 软件 ， 问 题 的 确定 就 成 为 可 能 。 


23.15 ”备份 与 恢复 


正如 在 第 15 章 和 第 16 章 中 了 解 到 的 ， 确 保 数据 库 系 统 的 可 恢复 性 是 一 项 复杂 的 任务 。 为 了 做 好 此 项 工作 ，DBA 需 要 了 解 
DBMSs 的 备份 与 恢复 功能 ， 它 如 何 连接 到 磁盘 存储 系统 ， 以 及 业务 数据 对 企业 的 影响 。 有 时 DBA 需 要 外 援 。 


幸运 的 是 ， 有 一 些 工 具 可 以 用 来 简化 和 自动 化 备份 与 恢复 的 过 程 。 备 份 与 恢复 工具 最 简单 的 形式 是 高 速 实用 程序 。ISV 实 用 
程序 可 以 加 速 制作 映像 副本 备份 ， 并 且 将 这 些 备 份 用 于 恢复 可 以 减少 停机 时 间 ， 还 可 以 增加 数据 的 可 用 性 。 一 些 工具 还 可 以 简化 
(不 只 是 加 速 ) 这 些 过 程 。 例 如 ， 许 多 高 速 备份 与 恢复 实用 程序 使 用 掩 码 与 通配符 技术 可 以 备份 整个 数据 库 或 数据 库 对 象 。 例 

如 ， 考 虑 下 面 的 命令 : 


COPY GL21DBX2.T* 


这 样 的 命令 可 能 用 来 制作 数据 库 中 每 一 个 表 空 间 的 映像 副本 备份 ， 数 据 库 名 为 GL21DBX2 且 以 字母 T 开 头 。 这 并 不 比 明确 列 
出 每 个 表 空间 简单 ， 但 是 如 果 一 个 新 的 符合 该 通配符 掩 码 的 表 空 间 添加 进来 ， 不 需要 对 备份 脚本 进行 编辑 。 


备份 与 恢复 工具 最 简单 的 形式 是 高 速 实用 程序 。 


也 有 其 他 产品 可 供 自动 完成 整个 恢复 过 程 。 这 些 工具 可 以 接受 恢复 请 求 ， 检 查 日 志和 了 映像 副本 备份 ， 建 议 如 何 进行 恢复 ， 或 
(EBEA) 构建 脚本 来 执行 恢复 ， 将 导致 大 部 分 数据 在 最 短 的 停机 时 间 内 恢复 。 


最 后 一 种 恢复 工具 是 基于 日 志 的 。 这 种 工具 可 以 用 来 检查 日 志 并 生成 反 向 的 SQL， 如 第 15 章 所 讨论 的 。 例 如 ， 假 设 DBA 错 
误 地 发 出 一 个 DELETE 语 句 。 使 用 这 种 工具 ，DBA 需 要 输入 程序 的 名 称 及 其 运行 的 时 间 。 工 具 会 检查 日 志 ， 找 到 DELETE 语 句 ， 
然后 创建 INSERT 语 句 来 重 现 已 删除 的 数据 。 只 需 运 行 INSERT 语 句 ， 数 据 库 就 可 以 恢复 。 当 然 ， 这 只 是 个 简单 的 例子 ， 但 当 错 误 
的 数据 库 修 改 需 要 快速 识别 和 纠正 时 ， 基 于 日 志 的 分 析 工 具 就 会 派 上 用 场 。 


23.1.6 ”数据 库 实用 程序 


许多 随 DBMS 一 起 发 布 的 免费 数据 库 实用 程序 都 很 简单 ， 不 提供 一 些 可 能 会 导致 性 能 低下 的 不 必要 的 程序 ， 尤 其 是 对 于 非常 
大 的 表 。 然 而 ， 需 要 这 些 工 具 来 填充 、 管 理 并 组 织 数 据 库 。 典 型 的 实用 程序 有 LOAD、UNLOAD、REORG、BACKUP 和 
RECOVER， 以 及 用 于 完整 性 检查 的 实用 程序 。 


许多 随 DBMS 一 起 发 布 的 免费 数据 库 实 用 程序 都 可 能 会 导致 性 能 低下 。 


第 三 方 供 应 商 提供 了 可 以 替代 数据 库 实 用 程序 的 支持 工具 ， 并 以 更 有 效 的 方式 提供 了 相同 或 更 多 的 功能 。 例 如 ， 你 肯定 听 说 
过 有 的 第 三 方 供应 商 声 称 他 们 的 实用 程序 可 以 在 任何 地 方 运行 ， 并 且 是 本 地 DBMS 实 用 程序 运行 速度 的 4~10 倍 。 他 们 说 的 是 否 
属实 ， 必 须 经 过 企业 的 数据 和 应 用 程序 的 证 实 (但 这 些 声称 相当 可 信 ) 。 在 使 用 任何 第 三 方 使 用 程序 之 前 ，DBA 都 应 确保 该 产 


品 至 少 符合 以 下 要 求 : 
" 不 破坏 数据 库 中 数据 的 完整 性 。 


. 至 少 可 以 提供 与 相应 本 地 实用 程序 相同 的 功能 。 例 如 ， 如 果 REORG 实 用 程序 可 以 重组 索引 和 表 空 间 ， 增 强 的 REORG 工 具 
必须 也 可 以 做 到 。 


> 不 破坏 标准 的 数据 库 功 能 。 例 如 ，DB2 的 映像 副本 在 DB2 的 系统 目录 中 进行 维护 ， 因 此 ， 增 强 的 DB2 备 份 工具 也 应 将 映像 
副本 存储 在 那里 。 


. 运行 速度 至 少 是 相应 数据 库 实用 程序 的 两 倍 。 例如， 如 果 Sybase DUMP 实 用 程序 备份 一 个 表 需 要 20 分 钟 ， 那 么 增强 的 备份 
工具 必须 在 10 分 钟 之 内 完成 相同 表 的 转 储 。 当 然 ， 这 不 是 一 个 硬性 规定 。 有 时 即使 处 理 时 间 适 度 增加 ， 也 足以 证 明 第 三 方 实用 程 
序 的 成 本 。 


“ 弥补 标准 数据 库 实 用 程序 的 缺陷 。 例 如 ， 如 果 LOAD 实 用 程序 不 能 以 集群 索引 的 顺序 加 载 数 据 ， 替 代 的 LOAD 实 用 程序 应 


该 可 以 做 到 。 


当 测 试 不 同 供应 商 的 实用 工具 时 ， 一 定 要 公平 。 例 如 ， 测 试 REORG 实 用 程序 之 前 要 进行 重 载 或 恢复 ， 否 则 ， 由 于 表 组 织 的 
级 别 不 同 ， 测 试 结果 会 有 偏差 。 此 外 ， 具 有 相同 数据 量 的 同一 个 对 象 要 在 每 个 工具 上 运行 ， 并 确保 每 两 次 运行 中 间 刷 新 一 次 数据 
高 速 缓存 。 最 后 ， 当 测试 每 个 产品 时 ， 确 保 系统 的 工作 负载 相同 (或 尽 可 能 接近 ) ， 因 为 并 发 工作 负载 可 能 会 使 基准 测试 结果 出 


当 测 试 不 同 供应 商 的 实用 工具 时 ， 一 定 要 公平 。 
实用 程序 管理 工具 


另 一 种 数据 库 实用 程序 是 程序 管理 器 。 这 种 工具 为 数据 库 实 用 程序 的 作业 流 的 创建 和 运行 提供 管理 支持 。 这 些 实用 程序 生成 
并 管理 工具 : 


自动 生成 实用 程序 参数 、JCL 或 命令 脚本 。 
监测 数据 库 实用 程序 的 运行 。 
当 触 发 异常 时 ， 自 动 调度 实用 程序 。 


* 对 实用 程序 少 干预 ， 只 重新 启动 。 例 如 ， 如 果 一 个 实用 程序 无 法 重新 启动 ， 程 序 管理 器 应 自动 终止 实用 程序 ， 然 后 重新 提 


23.1.7 ”数据 保护 、 治 理 、 风 险 和 合 规 性 工具 
正如 第 15 章 和 第 16 章 所 讨论 的 ， 数 据 库 的 安全 和 保护 ， 与 治理 、 风 险 和 合 规 性 (GRC) 的 需求 ， 一 并 强加 给 安全 性 与 合 规 
性 管理 。 有 工具 可 以 用 来 提高 数据 库 的 安全 性 和 合 规 性 ， 其 中 一 些 对 DBA 的 理解 和 使 用 很 重要 。 


另 一 方面 ，GRC 是 一 个 商业 命题 ， 此 类 别 中 大 部 分 的 解决 方案 都 与 DBA 无 天 。DBA 必 须 了 解 那些 与 DBMS 和 数据 库 集 成 的 
工具 ， 或 者 必须 施加 管理 工作 负载 或 性 能 影响 方面 的 额外 需求 。 


审计 工具 


审计 工作 是 对 实践 的 检查 ， 以 确定 其 正确 性 。 数 据 库 审计 软件 可 以 帮助 监测 数据 库 环 境 中 数据 的 控制 、 数 据 的 定义 和 数据 的 
完整 性 。 大 多 数 DBMS 提 供 有 限 的 审计 机 制 ， 但 这 些 功 能 通常 很 难 使 用 和 维护 。 审 计 工具 提供 更 精细 的 审计 能 力 ， 并 简化 审计 跟 
踪 的 报告 能 力 。 


审计 工具 提供 更 精细 的 审计 能 力 。 


典型 的 审计 工具 允许 在 DBMS 内 部 进行 不 同 级 别 的 审计 ， 例 如 ， 数 据 库 级 别 、 数 据 库 对 象 级 别 和 用 户 级 别 。 但 是 ， 捕 捉 这 么 
多 的 信息 (尤其 在 一 个 繁忙 的 系统 ) 可 能 会 导致 性 能 下 降 。 不 能 因为 实现 生产 所 需 的 审计 细节 而 削弱 保持 计算 机 系统 在 实践 中 运 
作 的 操作 。 


审计 跟踪 的 细节 和 真实 性 与 业务 系统 的 性 能 一 样 重要 。 审 计 跟 踪 必 须 足 够 详细 ， 捕 捉 数 据 库 变更 前 后 的 图 像 。 如 果 捕 捉 审 计 
细节 的 机 制 不 全 面 且 效率 不 高 ， 它 便 不 是 一 个 合 规 性 的 解决 方案 。 此 外 ， 审 计 跟 踪 必 须 人 存储 在 某 个 地 方 ， 既 可 以 保护 审计 信息 的 
真实 性 ， 同 时 允许 报告 的 无 颖 访问 。 


由 于 数据 库 数 据 的 潜在 变更 量 ， 有 用 的 审计 工具 必须 允许 选择 性 创建 审计 记录 ， 最 大 限度 地 减少 性 能 和 存储 问题 。 一 般 的 经 
验 法 则 是 ， 只 审计 那些 经 过 审计 才 合 规 的 数据 。 


一 般 ， 数 据 库 审计 工具 可 以 捕捉 的 有 : 
. 所 有 高 级 别 用 户 的 访问 (如 DBADMIN 和 SYSADMIN) 。 
- 授权 失败 。 
- SQL GRANT 和 REVOKE 语 和 句 。 
- 发 出 的 DDL 语句。 
- 发 出 的 DML A o 
- SQL BIND 请 求 或 新 的 程序 调用 。 
. 实用 程序 执行 。 


有 几 种 流行 技术 ， 可 以 对 数据 库 中 的 数据 进行 审计 。 到 目前 为 止 ， 最 好 的 技术 可 以 主动 监测 数据 库 服 务 器 上 的 直接 数据 库 操 
作 。 这 种 技术 可 以 在 对 数据 作出 请 求 时 捕捉 所 有 的 请 求 。 通 过 在 服务 器 级 别 捕捉 审 计 细 节 ， 该 软件 可 以 保证 所 有 的 访问 都 受 它 的 
监测 。 其 他 技术 如 基于 跟踪 的 审计 或 解析 数据 库 日 志 ， 可 能 会 错失 某 些 类 型 的 数据 库 活动 。 


一 个 强大 的 可 以 解决 合 规 性 问题 的 数据 库 访问 审计 解决 方案 ， 至 少 能 够 回答 如 下 问题 : 
1. 谁 访问 了 数据 ? 

2. 访 问 日 期 和 时 间 ? 

3. 使 用 了 什么 程序 或 客户 端 软件 ? 

4. 访 问 请 求 发 出 的 地 点 ? 


5. 发 出 了 什么 SQL? 


6. 请 求 是 否 成 功 ” 如 果 成 功 ， 检 索 到 多 少 行 数据 ? 
7. 如 果 请 求 修改 ， 修 改 了 什么 数据 ? (应 该 保留 变更 前 后 的 映像 副本 。 ) 


当然 ， 这 些 问 题 背 后 有 许多 细节 。 一 个 强大 的 数据 库 访 问 审计 解决 方案 应 该 为 长 期 存储 和 审计 细节 的 访问 提供 独立 的 机 制 。 
该 解决 方案 为 最 常见 的 查询 类 型 提供 固定 的 查询 ， 但 使 用 行业 标准 查询 工具 可 以 访问 审计 信息 ， 这 样 方便 用 户 根据 需要 定制 查 
询 。 


审计 工具 应 针对 支持 行业 和 政府 法 规 生成 一 套 预 先 包装 好 的 报告 。 例 如 ， 为 了 支持 PCI DSS， 该 工具 应 该 针对 证 明 合 规 性 提 
供 预 先 包装 好 的 报告 。 这 些 报 告 应 该 很 容易 生成 且 容 易 阅读 。 


具有 严格 的 安全 和 审计 需求 ， 或 显著 的 法 规 或 行业 合 规 性 需求 的 企业 应 考虑 使 用 数据 库 审计 工具 ， 因 为 大 多 数 DBMS 产 品 的 
审计 能 力 都 很 弱 。 


访问 趋势 分 析 工 具 


趋势 分 析 工 具 通 常 依赖 数据 库 的 审计 技术 ， 观 察 数据 库 访问 并 建立 趋势 和 模式 。 这 些 工 具 用 于 识别 并 禁止 不 合 规 范 的 行为 ， 
主动 停止 数据 库 工 具 。 


例如 ， 假 设 一 个 终端 用 户 ， 他 的 日 常 工作 就 是 与 敏感 数据 打交道 。 趋 势 分 析 工 具 可 以 建立 该 用 户 的 正常 模式 。 也 许 一 般 人 在 
早上 9: 00 和 11: 00 之 间 访 问 敏感 数据 ， 并 在 下 午 2: 0054: 00 之 间 再 次 访问 。 数 据 的 访问 有 条 不 亲 ， 通 常 逐个 客户 进行 。 这 
个 用 户 也 坚持 每 天 都 或 多 或 少 这 么 做 。 


然后 ， 在 一 个 星期 六 的 晚上 ， 该 用 户 试图 访问 东北 部 区 域 所 有 客户 的 敏感 数据 。 这 听 起 来 像 是 一 个 潜在 的 安全 问题 。 趋 势 分 
析 工 具 可 以 捕捉 到 并 报告 这 个 问题 ， 然 后 记录 下 这 个 非典 型 的 请 求 。 或 者 (对 于 更 谨慎 的 企业 ) 趋势 分 析 工 具 也 能 够 茶 止 这 个 非 
标准 的 访问 ， 得 到 管理 授权 后 才 人 允许 其 继续 。 


数据 访问 趋势 有 潜力 保护 那些 暗中 访问 的 数据 。 
数据 分 析 工 具 
另 一 种 有 用 的 数据 管理 工具 提供 数据 分 析 能 力 。 分 析 数 据 是 通过 洞悉 业务 数据 和 提炼 流程 的 方法 来 提升 数据 质量 的 。 


数据 分 析 工 具 可 以 用 来 发 现 结构 、 数 据 和 数据 中 的 异常 关联 。 分 析 技 术 帮 助 你 发 现 不 正确 的 数据 实例 ， 如 数据 与 元 数据 的 定 
义 不 符 、 模 式 不 匹配 、 值 不 准确 和 数据 元 余 。 


例如 ， 假 设 某 个 数据 库 表 的 列 包含 社会 安全 数字 。 那 么 它们 的 格式 应 该 为 xxx-xx-xxxx。 可 以 部 署 数据 分 析 工 具 对 这 个 
特殊 的 列 进行 检查 ， 显 示 不 符合 这 种 格式 的 数据 的 百分比 。 或 者 ， 假 设 你 不 知道 另 一 列 数据 的 具体 模式 。 在 这 种 情况 下 ， 数 据 分 
析 工 具 可 能 发 现 一 个 也 许 认为 根本 不 存在 的 模式 。 


无 论 如 何 ， 数 据 分 析 工 具 可 用 来 清理 数据 ， 例 如 ， 遵 从 和 数据 仓库 项 目 所 需 的 。 
数据 屏蔽 工具 


数据 屏蔽 是 一 种 额外 的 数据 保护 解决 方案 ， 可 用 来 对 数据 库 中 的 实际 值 进行 模糊 处 理 。 你 可 能 会 因为 屏蔽 报告 中 某 些 数据 的 
值 或 其 他 原因 而 隐藏 一 些 敏 感 数据 。PCI DSS 法 规 是 一 个 需要 数据 屏蔽 的 区 域 。 支 付 卡 的 号 码 不 能 全 部 显示 在 收据 上 。 用 信用 卡 
买 东西 的 时 候 ， 可 以 试 着 在 收据 上 找 一 下 信用 卡 的 号 码 ， 肯 定 有 屏蔽 。 


另 一 个 可 能 会 需要 数据 屏蔽 的 地 方 是 出 于 测试 目的 而 访问 生产 数据 的 。 测 试 过 程 需 要 有 效 的 数据 ， 但 并 不 需要 实际 值 。 数 据 
屏蔽 解决 方案 可 以 对 这 些 “ 真 实 ” 值 进行 处 理 ， 并 将 它们 转换 成 有 效 却 不 同 的 测试 值 。 


例如 ， 你 可 能 需要 屏蔽 社会 安全 号 码 。 你 不 希望 一 些 可 以 证 明 个 人 身份 的 信息 ， 如 姓名 、 地 址 等 ， 与 大 多 数 报告 中 某 个 实际 
的 社会 安全 号 码 相 关 。 


安全 工具 


数据 库 安 全 通常 是 通过 使 用 GRANT 和 REVOKE SQL 语 句 内 部 提供 给 数据 库 的 ， 显 式 和 隐 式 地 向 数据 库 用 户 授予 权限 。 某 些 
DBMS 产 品 提供 授权 出 口 ， 开 通 与 外 部 安全 管理 软件 包 的 通信 。 因 此 ， 通 过 使 用 公司 数据 安全 功能 来 管理 用 户 组 ,减轻 了 数据 库 
安全 的 管理 重担 。 


大 型 关系 数据 库 的 安全 实施 有 几 个 问题 。 其 中 最 重要 的 是 级 联 REVOKE 的 影响 。 如 果 某 个 曾 向 其 他 用 户 授权 的 用 户 的 授权 撤 
销 ， 所 有 相关 的 授权 也 将 撤销 。 


数据 库 安全 附加 工具 可 以 解决 这 个 问题 。 这 些 工 具 通常 可 以 对 REVOKE 产 生 的 影响 进行 分 析 ， 可 以 使 用 户 撤销 授权 并 有 选择 
地 重新 分 配 所 有 相关 的 授权 ， 或 者 通过 重建 适当 的 GRANT 语句 重新 应 用 隐 式 撤销 的 授权 ， 或 者 通过 撤销 授权 并 在 后 台 自 动 重新 
应 用 所 有 隐 式 REVOKE。 


数据 库 安 全 附加 工具 通常 可 以 对 REVOKE 产 生 的 影响 进行 分 析 。 


数据 库 安 全 工具 还 提供 其 他 功能 。 考 虑 数据 库 用 户 在 入 职 、 离 职 或 换 职位 时 的 管理 开销 ， 必 须 随 时 添加 或 删除 安全 。 一 款 好 
用 的 安全 工具 只 需 用 户 发 出 一 个 GRANT LIKE 命 令 ， 就 可 以 将 一 个 数据 库 对 象 的 数据 库 授 权 复 制 给 另 一 个 数据 库 对 象 ， 或 者 将 一 
个 数据 库 用 户 的 授权 复制 给 另 一 个 数据 库 用 户 。 


假设 一 名 DBA 换 到 另 一 个 部 门 。 安 全 工具 可 以 在 撤销 这 名 DBA 的 授权 之 前 ， 将 他 的 所 有 授权 分 配给 另 一 个 用 户 。 或 者 ， 假 
设 为 一 个 现 有 的 应 用 程序 创建 一 个 新 表 ， 它 需要 应 用 程序 中 其 他 的 表 有 相同 的 授权 。 安 全 工具 可 以 使 用 户 将 所 有 安全 从 一 个 表 复 
制 到 新 表 。 


有 一 种 数据 库 安全 产品 ， 它 不 会 增强 数据 库 的 安全 。 这 种 安全 蔡 代 产品 使 用 外 部 包 取 代数 据 库 安全 。 这 种 产品 的 主要 好 处 是 
它 巩固 了 数据 和 数据 库 的 安全 管理 。 第 二 个 好 处 是 可 以 消除 级 联 REVOKE 所 产生 的 影响 ， 因 为 大 部 分 外 部 数据 安全 包 不 会 级 联 安 
全 撤销 。 


安全 替代 产品 使 用 外 部 包 取 代数 据 库 安全 。 


数据 库 安全 替代 工具 也 有 弱点 。 这 些 工 具 不 符合 关系 模型 的 严格 定义 ， 其 中 指出 了 DBMS 必 须 控制 安全 。 有 些 工具 不 提供 所 
有 类 型 的 数据 库 安 全 。 例 如 ， 系 统 级 的 授权 经 常 省 略 。 另 一 个 缺点 是 ， 如 果 外 部 的 安全 程序 包 出 现 故障 ， 数 据 是 不 受 保护 的 。 


23.18 数据 仓库 、 分 析 和 商业 智能 


数据 仓库 管理 员 需 要 大 量 的 帮助 来 自动 化 仓库 数据 库 管理 ， 并 协助 用 户 有 效 地 查询 数据 仓库 。 
ETL 工 具 


ETL 代 表 提 取 、 转 欣 和 负载 。ETL 工 具 减 轻 了 数据 移动 和 转换 的 负担 ， 因 为 这 些 工 具 了 解 与 它们 一 起 工作 的 每 个 DBMS 的 数 


据 格式 和 环境 。 公 司 的 ETL 工 具 选 择 取决 于 以 下 因素 : 


.需要 支持 多 少 DBMS 产 品 ? 如 果 项 目 只 需要 一 个 DBMS (不 太 可 能 ) ， 那 么 DBMS 的 内 置 ETL 功 能 就 足以 满足 该 项 目的 需 


` 在 多 大 程度 上 ， 数 据 必须 跨 多 个 DBMS 产 品 进行 复制 ? 
- 数据 是 否 必须 跨 DBMS 产 品 进行 同步 ? 
- 数据 从 OLTP 源 系统 移动 到 数据 仓库 需要 多 少数 据 操作 和 转换 ? 
+ 数据 是 静态 的 还 是 动态 的 ? 
" 如 果 是 动态 的 ， 是 在 线 更 新 还 是 批量 更 新 ? AMARA? 
这 些 问题 的 答案 将 有 助 于 确定 必要 的 数据 仓库 工具 的 类 型 。 当 今 的 市 场 上 有 两 种 基本 类 型 的 数据 转换 工具 : 复制 和 传播 。 


复制 工具 从 外 部 应 用 程序 系统 和 异 构 数据 库 中 提取 数据 ， 并 将 这 些 数 据 填充 到 目标 数据 库 的 表 中 。 有 时 ， 这 类 工具 所 支持 的 
目标 数据 库 的 面 很 窗 ， 但 源 数据 库 的 面 通常 很 广 。 例 如 ， 某 工具 也 许 能 够 从 IMS、Oracle、SQL Server、 非 数据 库 文 件 和 其 他 
结构 中 提取 数据 ， 但 只 能 将 这 些 数据 加 载 到 DB2 表 中 。 在 选择 复制 工具 前 ,一 定 要 了 解 所 有 必须 支持 的 源 和 目标 数据 结构 ， 然 后 
谨慎 选择 复制 工具 。 


谨慎 选择 复制 工具 。 


传播 工具 在 源 (外 部 应 用 程序 和 异 构 数据 库 ) 发 生变 更 时 捕捉 数据 ， 然 后 将 其 插入 目标 数据 库 的 表 中 。 传 播 工具 在 功能 上 与 
复制 工具 类 似 ， 但 传播 工具 更 活跃 。 它 们 不 断 捕捉 外 部 系统 中 的 变更 ， 无 论 是 立即 应 用 到 目标 表 的 变更 ， 还 是 后 续 批量 更 新 的 变 
更 。 这 不 同 于 提取 工具 ， 提 取 工 具 是 捕捉 整个 数据 结构 ， 而 不 是 数据 修改 。 


在 异 构 的 数据 处 理 企业 中 ， 相 同 的 数据 可 能 需要 存储 在 多 个 DBMS 产 品 中 。 在 多 DBMS 环 境 中 ， 数 据 在 不 同 DBMS 间 的 移动 
是 一 项 烦琐 的 任务 。 ETL 工 具 可 以 用 于 不 同 的 DBM S 间 的 数据 转换 ， 甚 至 是 仓库 需求 以 外 的 DBM S。 


查询 和 报告 工具 


大 多 数 DBMS 产 品 都 捆绑 一 个 查询 工具 。 通 常 这 个 工具 非常 简陋 ， 只 人 允许 SQL 语 句 运行 且 不 要 求 输出 格式 。 大 多 数 企业 发 现 
这 些 工 具 在 开发 专业 的 、 格 式 化 的 报告 或 完整 的 应 用 程序 方面 存在 不 足 。 这 些 工具 可 能 在 供 没有 经 验 的 用 户 或 想 要 开发 和 执行 临 
时 查询 的 用 户 使 用 方面 能 力 不 足 。 


查询 和 报告 书写 工具 可 以 解决 这 些 不 足 。 无 需 编程 格式 化 报告 的 能 力 可 能 是 它们 最 大 的 资产 。 另 一 个 重要 的 功能 是 提供 了 一 
个 GUI 接口 ， 可 让 你 无 需 编写 复杂 的 SQL 就 能 开发 数据 处 理 请 求 。 


查询 和 报告 书写 工具 可 以 解决 捆绑 查询 工具 的 不 足 。 

许多 供应 商 提供 的 表 查 询 和 报告 工具 可 以 用 来 提升 临时 查询 的 能 力 。 这 些 产 品 通常 可 以 : 
.提供 标准 的 查询 格式 和 捆绑 报告 。 
* 提供 多 种 文件 格式 和 异 构 数 据 库 的 访问 。 


o 提供 广泛 的 格式 选项 。 


* 除了 SQL， 提 供 更 多 的 分 析 功 能 。 
> 使 用 静态 的 或 动态 的 SQL 来 存储 查询 。 
* 使 用 查询 工具 执行 数据 库 命令 。 


数据 库 查 询 工具 通常 使 用 点 击 式 、 拖 放 式 技术 来 大 大 缓解 报告 的 生成 过 程 。 用 第 4 代 语 言 (4GL) 访问 天 系数 据 也 很 受 欢 
迎 。 这 些 产 品 可 以 提供 比 报告 书写 工具 更 多 的 功能 ， 并 且 GU| 前 端的 使 用 使 它们 比 3GL 编 程 语 言 (如 VB、COBOL 或 C) 更 易于 
使 用 ，4GL 工 具 以 下 列 任 一 种 方式 工作 : 


用 第 4 代 语 言 访问 关系 数据 也 很 受 欢 迎 。 
. 使 用 4GL 语 法 开发 查询 ， 然 后 “在 幕后 ”转换 为 SQL 查询 。 
:将 SQL 藤 入 4GL 代 码 中 ， 并 像 SQL 骨 入 3GL 代 码 中 一 样 运行 。 
- 当 已 执行 的 SQL 很 难 或 不 可 能 审查 时 ， 使 用 混合 的 方法 。 


现在 ,新 的 DBMS 版 本 包括 对 查询 、 报 表 和 OLAP 活 动 的 更 高 级 的 支持 。 例 如 ，Microsoft SQL Server 分 析 服 务 提供 的 深入 
分 析 查 询 能 力 可 以 与 第 三 方 OLAP 工 具 相 媲 美 。 当 然 ， 这 些 只 是 SQL Server 的 服务 。 支 持 异 构 数据 库 分 析 和 查询 处 理 的 企业 ， 应 
考虑 使 用 第 三 方 工具 ， 支 持 企业 内 所 有 的 DBMS 产 品 。 


高 级 分 析 


高 级 分 析 是 一 种 以 业务 为 中 心 的 方法 ， 其 包 合 的 技术 有 : 帮助 建立 模型 并 模拟 创建 情景 ， 了 解 实际 情况 ， 以 及 推测 未 来 状 
态 。 为 了 使 企业 能 够 提高 其 业务 性 能 ， 高 级 分 析 使 用 了 数据 挖掘 、 预 测 分 析 、 应 用 分 析 、 统 计 信息 和 其 他 方法 。 


传统 的 商业 智能 使 我 们 了 解 此 时 此 刻 给 定 的 业务 情况 (甚至 其 中 的 一 些 原因 ) 。 高 级 分 析 对 情况 的 起 因 进 行 深入 探索 ， 并 提 
供 可 能 的 结果 。 高 级 分 析 虽 然 不 能 准确 无 误 地 预测 未 来 ， 但 它 可 以 提供 精确 的 模型 判断 即将 发 生 事件 的 可 能 性 。 通 过 让 企业 管理 
意识 到 可 能 的 结果 ， 了 解 他 们 的 决策 在 下 一 个 季度 或 下 一 年 可 能 产生 的 影响 ， 高 级 分 析 可 以 帮助 改进 业务 决策 。 


高 级 分 析 不 能 准确 无 误 地 预测 未 来 ， 但 它 可 以 提供 精确 的 模型 判断 即将 发 生 事件 的 可 能 性 。 


高 级 分 析 能 力 可 用 来 推动 广泛 的 应 用 ， 从 战术 应 用 如 欺诈 检测 ， 到 战术 分 析 如 客户 细 分 。 不 管 哪 种 应 用 ， 高 级 分 析 都 使 用 各 
种 形式 (如 预测 形式 、 描 述 形式 、 分 数 形式 和 配置 文件 形式 ) 提供 智能 ， 帮 助 企 业 更 好 地 了 解 客户 的 行为 和 业务 趋势 。 


大 多 数 DBA 不 会 用 到 高 级 分 析 工 具 ， 但 可 能 参与 设置 ， 使 它们 与 数据 仓库 和 其 他 数据 库 一 起 工作 。 


23.1.9 ”编程 和 开发 工具 


有 些 工 具 跨越 了 DBA 工 具 和 程序 员工 具 之 间 的 界线 。 例 如 ， 第 三 方 供应 商 提 供 的 许多 工具 ， 可 以 增强 数据 库 应 用 程序 开发 
环境 。 程 序 员 通 常 使 用 这 些 工 具 ， 但 DBA 经 常 参与 此 类 产品 的 审查 和 分 析 。 一 些 编程 和 开发 工具 可 以 执行 的 任务 包括 : 


. 程序 员 编 写 SQL 的 同时 ， 在 程序 编辑 器 中 测试 这 些 SQL 语句 。 


+ 执行 程序 和 SQL 语句 的 性 能 预测 估计 。 


- 在 编辑 会 话 中 解释 SQL 语句 。 


- 由 深入 的 规格 说 明生 成 完整 的 代码 。 有 些 工具 甚至 可 以 生成 SQL。 使 用 代码 生成 器 时 ， 一 定 要 确保 所 生成 的 代码 是 有 效 
的 ， 再 将 其 推 到 生产 状态 。 


: 创建 触发 器 、 存 储 过 程 和 用 户 自 定义 的 函数 时 ， 提 供 一 种 增强 的 环境 用 于 编写 过 程 SQL。 
“ 与 4GL 一 起 创建 数据 库 访问 程序 。 
由 于 数据 库 编 程 产 品 的 品种 很 多 ， 这 些 工 具 的 评估 应 视 情 况 而 定 。 
检查 点 /重启 工具 


某 些 DBMS 产 品 没有 提供 存储 检查 点 信息 的 固有 能 力 。 当 一 个 程序 失败 时 ， 重 启 是 很 困难 的 ， 因 为 没有 跟踪 最 后 一 次 提交 到 
数据 库 的 数据 ， 除 非 程序 员 在 程序 中 添加 跟踪 功能 。 工 具 可 供 某 些 DBMS 产 品 存储 检查 点 信息 ， 这 些 信息 可 以 在 重新 启动 应 用 程 
序 时 使 用 。 重 启 过 程 的 自动 化 是 一 些 检查 点 /重新 启动 解决 方案 所 提供 的 另 一 个 好 处 。 此 类 产品 可 用 于 大 批量 的 数据 库 应 用 程序 
发 出 许多 COMMIT。 许 多 这 样 的 产品 只 需要 对 程序 作出 很 小 的 修改 (如 果 存 在 ) 。 


测试 工具 


测试 工具 使 你 能 够 针对 一 条 测试 用 例 发 出 一 系列 测试 并 对 测试 结果 进行 分 析 。 测 试 工具 通常 用 于 所 有 类 型 的 应 用 程序 ， 但 有 
的 已 经 过 特别 的 扩展 ， 可 以 支持 数据 库 表 的 测试 。 


调试 工具 


SQL 调试 工具 可 用 来 识别 并 修复 有 难度 的 SQL 语句 中 的 语法 和 逻辑 错误 。 这 些 工 具 对 于 过 程 SQL 方 言 最 有 用 ， 如 PLM/SQL 和 
Transact-SQL。 


23.1.10 ”杂项 工具 
除了 前 面 已 经 讨论 过 的 工具 ， 还 有 各 种 各 样 的 专项 工具 。 他 们 中 的 一 些 不 是 数据 库 特 定 的 工具 ， 而 另 一 些 则 是 简单 实用 的 单 
用 途 程序 ， 可 以 帮助 管理 数据 库 系统 。 下 面 看 一 些 杂 项 工具 。 


有 各 种 各 样 的 专项 工具 。 
空间 管理 工具 


大 多 数 DBMS 都 提供 空间 利用 率 的 基本 统计 信息 ， 但 空间 管理 和 性 能 调整 所 需 的 深入 统计 信息 对 于 重型 管理 通常 是 不 够 的 。 
例如 ， 大 多 数 DBM 缺乏 对 其 所 使 用 的 相关 文件 的 需求 进行 监控 的 能 力 。 当 这 些 文件 进入 扩展 盘 或 经 过 碎片 整理 时 ， 性 能 会 受到 
影响 。 没 有 空间 管理 工具 ， 监 测 这 一 信息 的 唯一 方法 是 难以 想象 且 难 以 使 用 的 操作 系统 命令 。 这 是 一 项 单调 乏味 的 工作 。 

此 外 ， 每 个 DBMS 分 配 空间 的 方式 不 同 。DBMS 分 配 空间 的 方式 可 能 会 导致 低 效 的 磁盘 使 用 情况 。 有 时 分 配 了 空间 ， 但 数据 
库 不 会 使 用 。 空 间 管理 工具 是 深 挖 已 用 的 空间 量 与 已 分 配 的 空间 量 的 唯一 方法 。 


每 个 DBMS 分 配 空间 的 方式 都 不 同 。 


空间 管理 工具 往往 与 其 他 数据 库 和 系统 管理 工具 相互 作用 ， 如 操作 系统 空间 管理 工具 、 数 据 库 分 析 工 具 、 系 统 目 录 查 询 和 管 
理工 具 以 及 数据 库 实 用 程序 生成 器 。 


压缩 工具 


降低 存储 成 本 的 标准 工具 是 压缩 实用 程序 。 这 类 工具 通过 把 一 个 算法 应 用 到 表 中 的 数据 来 运作 ， 这 样 就 可 以 在 一 个 更 加 紧凑 
的 区 域 对 数据 进行 编码 。 当 存储 数据 所 需 的 空间 减少 时 ， 成 本 就 降低 了 。 


压缩 工具 必须 在 数据 添加 到 表 和 随后 修改 时 对 其 进行 压缩 ， 然 后 检索 数据 时 进行 解压 缩 。 此 外 ， 一 些 工 具 可 用 于 压缩 数据 库 
日 志 ， 使 更 多 的 日 志 信息 在 加 载 到 另 一 个 介质 之 前 可 以 保留 在 磁盘 上 。 


通常 可 以 通过 在 数据 库 或 操作 系统 级 别 使 用 APl 来 指定 第 三 方 压缩 程序 。 有 时 ， 应 用 压缩 程序 必须 删除 并 重新 创建 表 。 


在 一 般 情况 下 ， 压 缩 算法 会 增加 CPU 的 成 本 ， 但 同时 会 减少 存储 和 Il/MO 成 本 。 这 种 权衡 并 不 是 对 所 有 的 表 都 有 利 。 例 如 ， 如 
个 压缩 程序 节省 30% 的 存储 成 本 ， 但 会 增加 CPU 消耗 ， 不 降低 MO， 这 种 权衡 可 能 就 是 不 利 的 。 


AE 
l 


压缩 工具 可 以 通过 减少 要 存储 的 行 的 大 小 来 降低 存储 。CPU 消 耗 通常 会 增加 ， 因 为 压缩 和 解压 缩 行 都 需要 额外 的 处 理 。 然 
而 ，MO 成 本 会 降低 〈 可 能 是 戏剧 性 地 降低 ) 。 


压缩 工具 可 以 减少 要 存储 的 行 的 大 小 。 


某 些 DBMS 本 身 支持 压缩 ， 不 需要 第 三 方 的 产品 。 第 三 方 压缩 工具 的 主要 优点 在 于 ， 大 多 数 供应 商 可 以 提供 额外 的 灵活 性 和 
多 种 适用 于 不 同类 型 数据 的 压缩 算法 。 


在 线 标准 手册 


产品 可 提供 实施 、 访 问 和 管理 数据 库 的 “固定 ”标准 。 这 些 工具 对 于 使 用 新 数据 库 的 企业 特别 有 用 。 通 过 购买 在 线 的 标准 手 
册 ， 新 的 (甚至 更 多 有 经 验 的 ) 企业 可 以 对 每 个 新 的 DBMS 快 速 上 手 。 


每 当 DBMS 产 品 有 新 版 本 ， 第 三 方 供应 商 自 动 发 布 更 新 ， 每 个 人 都 会 从 这 些 产品 中 受益 。 在 线 手 册 可 作为 新 DBMS 版 本 ( 例 
如 ， 从 Oracle8i 到 Oracle9i) 的 廉价 培训 。 


在 线 手 册 可 作为 廉价 培训 。 

任何 提供 数据 库 标准 的 产品 都 应 : 

. 提供 在 线 的 联网 访问 ， 让 所 有 开发 者 和 DBA 都 可 以 访问 该 手册 。 
“ 可 以 扩展 ， 以 便 添 加 额外 的 标准 。 


可 以 修改 ， 以 便 可 以 对 提供 的 标准 进行 修改 ， 使 之 适合 以 前 的 企业 标准 (如 命名 约定 和 编程 标准 ) 。 
其 他 工具 


有 许多 数据 库 工具 类 型 可 供 选 择 。 本 章 中 的 类 别 涵盖 了 工具 的 主要 类 型 ,但 并 不 是 所 有 的 工具 都 很 容易 归 类 。 例 如 ， 考 虑 一 
个 数据 库 空间 计算 器 。 它 读 取 表 的 DDL 和 表 的 行 数 信息 ， 来 估计 空间 的 需求 。 空 间 计算 器 通常 由 其 他 工具 提供 ， 如 空间 管理 工具 
或 数据 库 设 计 和 建 模 工具 


So 


此 外 ， 一 些 标准 的 系统 管理 和 编程 工具 可 以 用 来 优化 数据 库 环境 。 例 如 ， 第 三 方 排序 工具 可 以 用 来 在 加 载 数据 之 前 对 数据 进 


行 预 排 序 ， 或 者 对 那些 需要 在 数据 库 程序 测试 期 间作 比较 的 输出 结果 进行 排序 。 


此 外 ， 新 类 型 的 产品 会 定期 公布 。 例 如 ， 一 家 供应 商 最 近 发 布 了 一 款 分 析 SQL 的 产品 ， 可 以 访问 特定 的 表 并 使 用 一 套 专业 的 
规则 来 推荐 最 高 效 的 索引 。 一 定 要 时 刻 天 注 那些 本 章 没有 提 及 的 新 的 、 有 用 的 工具 类 型 。 


新 类 型 的 产品 会 定期 公布 。 


23.2 ”研究 原生 DBA 工 具 


购买 任何 第 三 方 的 DBA 工 具 之 前 ,一 定 要 彻底 检查 DBMS 供 应 商 所 提供 的 功能 。DBMS 供 应 商 大 大 改善 了 原生 工具 的 功能 ， 
如 果 最 近 你 没有 仔细 调查 过 这 些 功能 ， 建 议 你 看 一 看 。 


例如 ，Oracle Enterprise Manager 和 Microsoft SQL Server SSMS 是 功能 相当 丰富 的 产品 。 但 还 需要 小 心 ， 因 为 有 时 只 有 
一 组 基本 的 功能 可 以 立即 使 用 ， 而 其 他 功能 则 需要 额外 的 许可 并 需要 支付 额外 的 费用 。 


同 构 企业 ( 仅 支持 一 个 DBMS) 常常 使 用 DBMS 供 应 商 的 DBA 工 具 就 可 以 做 得 很 好 ; 异 构 企 业 (有 多 个 DBMS 产 品 ) ， 从 第 
三 方 购 买 工具 来 管理 多 个 数据 库 系 统 可 能 会 更 好 。 [1] 


[1 大 多 数 情况 下 ，DBMS 供 应 商 的 DBA 工 具 仅 支持 同一 个 供应 商 提供 的 DBMS 产 品 。 例 如 ， 一 般 不 要 希望 Oracle 的 DBA 工 具 可 以 
管理 Mictosoft Sevet 数 据 库 。 


23.3 ”评估 DBA 工 具 供应 商 


先进 的 企业 使 用 那些 有 助 于 自动 化 数据 库 管 理 任务 的 先进 软件 工具 来 增强 它们 的 DBA 工 作 人 员 。 有 多 个 类 别 的 数据 库 工具 
可 供 企业 提高 数据 库 管理 的 效率 。 有 时 ，DBA 必 须 从 多 个 供应 商 提 供 的 类 似 工具 列表 中 选择 合适 的 工具 ,或 者 研究 新 的 供应 
商 ， 因 为 它 提供 的 工具 主要 供应 商 没 有 提供 。 


虽然 选择 数据 库 工 具 最 重要 的 方面 是 工具 的 功能 及 其 满足 企业 的 需求 的 方式 ， 但 是 产品 供应 商 的 性 质 和 稳定 性 同样 重要 。 本 
节 提 供 了 一 些 在 选择 数据 库 工具 供应 商 时 需要 考虑 的 问题 : 


产品 供应 商 的 性 质 和 稳定 性 很 重要 。 


“ 供应 商 做 生意 多 久 了 ? 它 为 特定 的 DBMS 产 品 〈 你 管理 的 ) 提供 工具 有 多 久 了 ? 一 般 情况 下 ， 供 应 商 做 生意 的 时 间 越 久 越 
好 ， 提 供 工具 的 时 间 越 久 越 好 。 


> 你 所 在 的 公司 是 否 有 该 供应 商 提 供 的 其 他 DBA 或 系统 管理 工具 ? 这 些 工 具 的 用 户 的 满意 度 如 何 ? 
其 他 企业 是 否 满意 你 所 选择 的 工具 ? 获得 其 他 使 用 相同 工具 的 公司 列表 ， 并 联系 其 中 的 几 个 。 


- 该 供应 商 是 否 提供 了 24 小 时 支持 的 电话 号 码 ? 如 果 没 有 ， 它 的 操作 时 间 是 什么 时 候 ? 是 否 有 免费 电话 号 码 ? 如 果 没 有 ， 请 
求 客服 支持 时 一 定 要 确定 长 途 电话 的 成 本 。 如 果 你 不 想 花 太 多 的 长 途 话费 ， 你 也 许可 以 使 用 Skype 或 其 他 VOIP 技术 来 尽量 减少 这 


. 该 供应 商 是 否 提 供 在 线 技术 支持 ?在 与 其 建立 合作 关系 之 前 你 是 否 可 以 访问 并 对 其 实用 性 进行 评估 ? 如 果 可 以 ， 在 针对 供 
应 商 的 产品 提问 题 之 前 ， 浏 览 常见 问题 和 已 经 报告 的 问题 。 请 记 住 ，Web 支 持 只 能 是 对 电话 支持 的 补充 ， 不 是 替代 。 


. 评估 技术 支持 电话 号 码 的 响应 。 拨 打 电 话 号 码 咨 询问 题 ， 一 天 至 少 五 次 : 上 午 入 点 之 前 、 中 午 左 右 、 下 午 五 点 之 前 、 晚 上 
九 点 之 后 和 午夜 过 后 。 这 些 都 是 可 以 发 现 供应 商 的 支持 是 否 有 问题 的 时 候 。 电 话 是 否 占线 ?是 否 需要 等 待 ”多 长 时 间 ? 电话 接 通 
后 ， 回 答 问题 是 否 准确 ? 态度 是 否 友 好 ? 接听 电话 的 人 是 否 必须 寻求 其 他 更 了 解 技术 知识 的 人 帮忙 (这 可 以 表明 一 些 潜在 的 问 
题 ) ? 如 果 你 真 的 想 测试 供应 商 ， 请 在 午夜 过 后 拨打 电话 ， 衡 量 下 班 之 后 它 对 支持 请 求 的 响应 。 


供应 商 是 否 提供 你 的 企业 以 后 可 能 需要 的 其 他 工具 ? 如 果 提供 ， 它 们 在 功能 上 是 否 与 这 个 工具 集成 ? 该 供应 商 是 否 针对 
以 上 讨论 的 所 有 或 一 部 分 工具 类 别提 供 解决 方案 ”明智 的 做 法 是 与 可 以 满足 你 所 有 数据 库 管 理 需求 而 不 是 一 部 分 的 供应 商 合作 。 
但 是 ， 多 供应 商 策略 可 能 有 助 于 最 大 限度 地 降低 成 本 (因为 这 样 可 以 使 供应 商 之 间 进 行 价格 竞争 ) 。 


NC 


. 该 供应 商 的 工具 是 否 与 其 他 工具 集成 ? 例如， 分 析 数 据 库 的 产品 来 确定 是 否 需 要 teorg， 应 将 reorg 与 企业 的 作业 调度 集成 在 


. 该 供应 商 是 否 提 供 培训 ? 是 现场 的 吗 ? 是 否 提 供 DBMS 培 训 和 工具 的 培训 ? 基于 计算 机 的 培训 是 否 可 用 于 该 供应 商 的 工 


具 ? 
. 安装 、 技 术 和 用 户 手 册 是 否 分 为 软 复制 和 硬 复制 ? 提供 的 硬 复制 是 否 免费 ? 如 果 免费 ， 有 多 少 复制 ”如 果 收 费 ， 沉 用 是 多 
少 ? 


* 该 供应 商 除了 回答 其 产品 的 问题 ， 是 否 还 愿意 免费 回答 其 他 数据 库 问 题 ? 例如 ， 如 果 供 应 商 提供 的 是 Dtacle 工 具 ， 支 持 人 
员 是 否 能 够 熟练 地 回答 有 关 Oracle 数 据 库 管理 的 问题 有 时 供应 商 可 以 做 到 ， 但 它们 一 般 不 宣传 这 一 事实 。 尝 试 拨打 技术 支持 号 


码 吧 。 
* 该 供应 商 是 否 在 本 地 有 办 公 室 ? 如 果 没有 ， 技 术 人 员 是 否 可 以 随时 提供 现场 错误 解决 方案 ?如果 是 ， 价 格 如 何 ? 
+ 该 供应 商 是 否 通过 速递 邮件 提供 额外 的 文档 或 错误 解决 方案 信息 ?是 否 发布 了 传真 号 码 ? E-mail dL? 


. 如 何 提供 软件 修复 ? 电子 方式 ? 磁带 ? 通过 Web? 通过 FTP? 是 否 需要 完整 的 重复 安装 ? 是 否 使 用 快速 切换 实现 修复 ? 对 


于 大 型 机 用 户 ， 供 应 商 是 否 支持 SMP/E? 
. 在 短 时 间 内 ， 供 应 商 愿意 花 多 少 工时 来 解决 问题 ? 解决 严重 的 产品 问题 是 否 保 证 时 间 限 制 ? 


. 供应 商 是 否 愿 意 派 遗 销售 代表 到 现场 展示 为 你 量 身 打造 的 产品 ?或 者 只 是 “电话 销售 ”? 如 果 供应 商 不 愿意 派 遗 菜 个 人 到 
现场 ， 这 可 以 表明 你 应 付 的 是 个 小 供应 商 或 者 一 个 日 后 很 难 应 付 的 供应 商 。 


`- 该 供应 商 是 否 是 DBMS 供 应 商 (如 Microsoft、IBM 和 Oracle) 的 合作 伙伴 ? 供应 商 的 工具 多 久 修 改 一 次 ， 以 支持 DBMS 的 新 


版 本 ? 


. 最 近 是 否 有 任何 行业 出 版 物 对 该 供应 商 的 工具 进行 了 评论 或 强调 ? 如 果 有 ， 找 到 出 版 物 阅读 那 篇 文章 。 有 时 ， 文 章 在 网 上 
可 以 看 到 。 确 保 文章 不 是 供应 商 自己 写 的 ， 而 是 一 个 中 立 的 第 三 方 ( 最 好 是 客户 、 顾 问 或 行业 分 析 师 ) 。 


* 该 供应 商 是 否 愿 意 提供 使 用 过 该 产品 并 可 以 保证 其 功能 的 顾问 列表 ? 


. 该 供 应 商 是 否 愿意 协助 制定 成 本 理由 ? 大 多 数 供应 商 很 期 望 做 成 生意 ， 它 们 都 很 愿意 提供 成 本 理由 帮助 你 说 服 上 级 管理 部 


门 采用 该 工具 。 


- 该 供应 商 是 否 提 供 了 运行 其 产品 的 样本 脚本 (或 大 型 机 的 JCL) ? 是 否 提供 了 简单 易 用 的 “入 门 ”手册 ? 


- 当 升 级 硬件 或 DBMS 时 ， 供 应 商 是 否 收取 升级 费用 ? 合同 条 款 和 条 件 的 灵活 性 如 何 ? 


供应 商 是 否 愿意 为 每 年 的 维护 费用 设 定 一 个 上 限 ? 


. 如 果 出 售 或 倒闭 ， 供 应 商 是 否 提供 该 工具 的 源 代码 ? 源 代码 是 否 托管 ? 如果 没有 ， 假 如 供应 商 被 收购 ， 合 同 的 条 款 和 条 件 
是 否 可 以 变动 ? 鉴于 当今 的 行业 状态 (大 规模 的 供应 商 整 合 ) ， 这 是 一 个 需要 考虑 的 重要 问题 ， 否 则 你 可 能 会 被 一 个 不 再 支持 的 
产品 或 者 一 个 被 收购 的 供应 商 套牢 。 


- 该 供应 商 当 前 的 状态 如 何 ? 近 期 是 否 发 生 过 任何 导致 市 场 份 额 降低 的 事件 或 业务 下 滑 ?” 公司 最 近 是 否 有 过 裁员 ? 是 否 有 任 
何 针 对 该 公司 的 未 解决 诉讼 ? 这 些 问题 的 答案 可 以 帮助 确定 供应 商 的 稳定 性 。 


- 该 供应 商 是 否 为 你 公司 使 用 的 所 有 DBMS 产 品 提供 数据 库 管 理工 具 ? 同一 个 工具 (使 用 相同 的 接口 ) 是 否 可 以 用 来 管理 跨 
多 个 操作 系统 的 多 个 数据 库 ? 


“ 供应 商 的 等 级 提升 请 求 如 何 ? 每 个 请 求 的 等 级 相同 ， 还 是 菜 些 客户 更 受 青 睐 ? 如 果 是 后 一 种 情况 ， 你 如 何 确保 成 为 供应 商 


青睐 的 客户 之 一 ? 


这 些 问 题 可 以 为 你 的 企业 评估 DBA 工 具 供应 商 提 供 依据 。 至 于 哪个 标准 对 你 的 企业 最 重要 ， 你 自己 判断 。 你 可 能 会 考虑 为 


每 个 问题 应 用 一 个 加 权 系 数 对 其 答案 进行 打分 。 这 样 做 时 ， 一 定 不 要 让 供应 商 知道 这 个 加 权 ， 从 而 确保 供应 商 提供 的 任何 帮助 都 
是 “真实 的 ” 


自主 研发 的 DBA 工 具 
一 些 企业 打造 自主 研发 的 DBA 工 具 来 支持 它们 的 DBMS 环 境 。 这 类 工具 的 开发 和 维护 通常 是 由 DBA 或 系统 程序 员 进 行 的 。 
我 见 过 一 些 自主 研发 的 工具 ， 它 们 可 以 解决 的 数据 库 管理 方面 的 问题 ， 供 应 商 销售 的 工具 也 可 以 解决 。 


自主 研发 的 DBA 工 具有 利 也 有 次。 大 多 数 企 业 认为 减少 成 本 是 最 大 的 好 处 。 在 某 些 情 况 下 ， 这 可 能 是 正确 的 ， 但 往往 不 
是 。 虽 然 自主 研发 不 会 友 生 第 三 方 工具 的 初始 费用 ， 但 日 常 维护 费用 让 人 望而却步 。 每 次 安装 DBMS 的 新 版 本 时 ， 需 要 再 次 对 自 
主 研发 的 工具 进行 测试 ， 有 时 甚至 需要 重新 编写 代码 。 这 不 仅 增 加 成 本 ， 还 会 占用 DBA 宝 贵 的 管理 时 间 。DBA 必 须 对 自主 研发 
的 工具 进行 维护 ， 而 不 是 管理 企业 的 数据 库 。 


自主 研发 的 工具 有 利 也 有 商 。 


新 DBA 开 始 涉 足 此 类 业务 时 需要 了 解 DBA 团 队 的 工具 理念 。 公 司 打造 自己 的 工具 ， 还 是 购买 第 三 方 工 具 ? 有 时 答案 是 这 两 
种 方法 都 使 用 。 


234. INS 


第 三 方 DBA 工 具 可 以 显著 提高 访问 关系 数据 的 应 用 程序 的 效率 。 当 评估 产品 时 ， 寻 找 对 你 企业 最 重要 的 功能 。 在 本 章 所 讨 
论 的 基础 上 ， 考 虑 采用 检查 清单 用 于 产品 比较 。 请 记 住 ， 大 多 数 DBMSs 在 管理 、 数 据 访 问 、 性 能 监测 和 应 用 程序 开发 领域 都 不 尽 
善 尽 美 。 第 三 方 DBA 工 具 可 以 帮助 最 大 程度 地 减少 这 些 弱 点 ， 并 减轻 你 在 数据 库 管 理 方面 的 痛苦 。 


采用 检查 清单 用 于 产品 比较 。 


23.5 ”回顾 


1. 请 说 出 性 能 工具 的 三 种 类 别 并 简单 描述 它们 特有 的 能 力 。 

2. 如 果 上 级 让 你 制定 DBA 工 具 的 成 本 理由 ， 你 如 何 最 大 程度 地 减少 制定 那样 的 理由 的 工作 量 ? 

3. 什 么 类 型 的 工具 对 一 个 数据 库 管理 方面 全 新 的 企业 最 有 帮助 ? 

4. 目 录 可 视 性 工具 的 用 途 是 什么 ? 

5. 在 大 多 数 DBMS 产 品 已 经 附带 了 一 组 实用 程序 的 情况 下 ， 仍 从 第 三 方 供应 商 那 里 购买 数据 库 实用 程序 ， 其 好 处 是 什么 ? 
6. 使 用 表 编 辑 器 修改 生产 数据 库 表 中 的 数据 可 能 会 导致 哪 种 类 型 的 问题 ? 

7. 缩 写 ETL 代 表 什么 ? 

8. 为 什么 说 通 过 契约 保证 供应 商 将 企业 所 购买 的 任何 工具 的 源 代码 进行 托管 是 很 重要 的 ? 

9. 传 播 工 具 与 复制 工具 之 间 的 区 别 是 什么 ? 


10. 请 说 出 7 个 数据 库 审计 工具 应 该 可 以 解决 的 问题 。 


第 24 章 ”DBA 的 经 验 法 则 


本 书 的 前 23 章 涵盖 了 与 数据 库 管理 法 则 相关 的 实践 、 政 策 和 过 程 。 本 章 为 DBA 实 施 这 些 实践 、 政 策 和 过 程 提供 了 指导 。 数 
据 库 管理 是 一 个 技术 性 很 强 的 学 科 ， 同 时 它 也 是 一 个 非常 政治 化 的 学 科 ，DBA 在 企业 内 是 高 度 引 人 注 目的 。DBA 应 该 以 正确 的 
态度 和 足够 的 技术 知识 武装 自己 ， 然 后 再 尝试 实行 数据 库 管 理 。 


下 面 的 章节 概括 了 一 些 基 本 的 指导 ， 可 以 帮助 你 成 为 一 名 全 面 的 、 受 人 尊重 的 专业 的 DBA。 


DBA 应 该 以 正确 的 态度 和 足够 的 技术 知识 武装 自己 。 


241 ”记录 每 一 件 事 


作为 一 名 DBA， 在 执行 工作 的 过 程 中 ， 你 可 能 会 遇 到 许多 具有 挑战 性 的 任务 和 耗费 时 间 的 问题 。 一 定 要 记录 下 解决 问题 和 
克服 挑战 的 全 部 过 程 。 一 旦 将 来 再 遇 到 相同 或 类 似 的 问题 ， 这 样 的 文档 相当 有 价值 。 直 接 看 笔记 要 比 任 记忆 重建 一 个 场景 更 好 。 


记录 下 的 笔记 和 细节 也 可 以 作为 学 习 辅助 与 你 的 同行 共享 。 记 录 下 克服 难题 所 采取 的 步骤 ， 这 样 的 笔记 可 以 用 来 提高 后 续 


DBA 的 努力 ， 并 可 以 预防 日 后 再 发 生 同 样 的 问题 。 


24.2 ”一 切 都 井然 有 序 


如 果 你 喜欢 收集 东西 ，DBA 就 是 适合 你 的 工作 。 将 工作 中 遇 到 的 一 切 都 收 好 ， 是 个 不 错 的 做 法 。 这 包括 但 不 仅 限于 : 
成 为 收藏 家 。 


. 手册 ， 旧 的 和 新 的 ， 在 线 的 和 打印 的 ; 


* 脚本 ， 变 更 的 、 运 行 重组 的 等 ; 

* 程序 ， 快 速 修复 的 程序 、 实 例 程序 等 ; 

. 程序 和 演示 ， 来 自 网 络 研讨 会 、 用 户 组 和 各 种 会 议 的 ; 

笔记， 来 自 设 计 审查 、 规 范 会 议 、 团 队 会 议 、 用 户 组 和 会 议 的 等 ; 
. 教科 书 ， 来 自 你 参与 的 任何 课程 〈 连 同 其 他 技术 类 书籍 ) ; 

-和 白皮书 ; 

. 报告 ， 来 自 性 能 监视 器 、 查 询 、 应 用 程序 等 ; 

` 文章， 来自 杂志 或 网 站 链接 ; 

参考 手册 ， 你 使 用 的 所 有 DBMS 和 工具 ; 

* CD， 和 包含 产品 演示 、 产 品 、 和 白皮书 、 各 种 演示 等 。 


当然 ， 保 证 所 有 的 信息 都 组 织 有 序 并 且 可 以 访问 是 一 件 非常 有 挑战 的 事情 ， 尽 管 如 此 ， 保 存 好 从 过 程 到 链接 再 到 脚本 的 所 有 
东西 ， 在 DBA 陷 入 困境 时 ， 可 以 帮助 他 们 确定 合适 的 行动 步骤 。 但 组 织 、 远 见 和 准备 也 是 必需 的 。 


为 将 要 发 生 的 事情 做 准备 不 能 依靠 一 套 先 进 的 DBA 工 具 或 一 推 存 档 信息 ， 而 是 要 充分 了 解 你 的 DBMS、 数 据 库 、 报 告 结构 以 
及 业务 与 数据 之 间 的 相互 关系 ， 并 且 按 计划 按部就班 地 做 事 。 等 到 发 生 了 故障 ， 再 四 处 寻找 “完美 ”的 脚本 (你 可 能 从 来 没有 测 
试 过 ) ， 只 会 导致 失败 。 


24.3 ”自动 化 


如 果 可 以 自动 化 ， 为 什么 还 要 手动 去 做 ”也 许 手动 做 的 任何 事情 ， 计 算 机 都 可 以 做 得 更 好 (前 提 是 计算 机 经 过 正确 编程 ) 。 
一 旦 任务 实现 了 自动 化 ， 节 省 下 来 的 宝贵 时 间 可 能 用 来 解决 其 他 问题 。 


此 外 ， 不 要 做 无 谓 的 重复 工作 。 有 人 在 某 个 时 间 某 个 地 方 可 能 已 经 解决 了 你 正在 尝试 解决 的 问题 。 不 妨 到 一 些 有 免费 脚本 可 
以 下 载 和 共享 的 网 站 去 寻找 。 如 果 你 有 多 的 预算 ， 还 可 以 购买 在 第 23 章 讨论 的 DBA 工 具 。 


不 要 做 无 谓 的 重复 工作 。 


当然 ， 你 可 以 将 自动 化 的 想法 进一步 延伸 。 有 天 自我 管理 的 数据 库 系 统 ， 已 经 有 很 多 的 讨论 和 供应 商 的 大 岩 宣 传 。DBMS 供 
应 商 在 自动 化 管理 功能 方面 取得 了 很 大 的 进步 。 但 即使 这 样 ， 也 有 许多 原因 使 DBA 这 一 职业 没有 快速 消失 。 自 我 管理 的 数据 库 
系统 (时 然 是 个 令 人 称赞 的 目标 ) ， 还 无 法 提供 “无 人 值守 ”的 DBM SS 环境。 数据 库 维 护 和 性 能 管理 正在 一 点 点 一 步 步 地 改善 、 
简化 和 自动 化 。 但 是 你 知道 吗 ” 在 我 的 有 生 之 年 〈 可 能 还 有 你 孩子 的 有 生 之 年 ) ， 自 动 化 都 不 会 让 DBA 不 复 存在 。 


许多 自我 管理 的 功能 都 需要 使 用 DBMS 供 应 商 ， 如 Oracle Enterprise Manager 或 IBM Data Studio， 提 供 的 内 置 工具 (或 
免费 工具 ) 。 但 许多 企业 更 喜欢 使 用 可 以 管理 来 自 多 个 供应 商 的 数据 库 (Oracle、IBM、Microsoft 等 ) 的 异 构 解 决 方案 ， 它 们 
都 来 自 单一 控制 台 。 这 些 工 具 中 的 大 部 分 在 很 多 年 前 都 已 经 有 自我 管理 功能 了 ， 却 没有 让 DBA 过 时 。 


面 对 现实 吧 ， 很 多 的 DBMS 供 应 商 所 声称 的 比 事 实 更 夸张 。 一 些 自我 管理 的 功能 都 在 几 年 之 前 宣布 ， 它 们 将 普遍 应 用 于 
DBMS。 所 有 供应 商 的 声称 都 正好 相反 ,今天 没有 哪个 数据 库 是 真正 百 分 百 地 自 成 一 体 。 每 个 数据 库 都 需要 一 定 程度 的 DBA 管 
理 ， 即 使 使 用 了 当今 最 好 的 自我 管理 功能 。 


未 来 会 怎么 样 ? 事情 会 变 得 更 好 ， 可 能 更 加 昂贵 。 你 不 觉得 DBMS 供 应 商 正在 免费 构建 这 种 自我 管理 技术 吗 ? 但 是 ， 先 不 考 
虑 成 本 ， 有 什么 是 自我 管理 的 数据 库 真 正 可 以 管理 的 ? 


大 多 数 性 能 管理 解决 方案 允许 设置 性 能 阅 值 。 一 个 辣 值 允许 设置 一 个 触发 器 : “ 当 百 分 之 X 的 表 页 面包 含 链 接 行 或 存储 残片 
时 ， 安 排 一 次 重组 。” 但 是 ， 这 些 立 值 只 是 与 你 设置 的 变量 一 样 ， 定 义 了 跳闸 阅 值 时 要 采取 的 行动 。 有 些 软件 非常 智能 ， 也 就 是 
说 ， 它 “知道 ”什么 可 以 做 ， 什 么 时 候 做 。 此 外 ， 它 也 许 能 够 借鉴 过 去 的 行动 和 结果 。 通 常 构建 的 自我 管理 系统 越 智能 ， 结 果 越 
好 。 但 是 我 们 中 间 有 谁 会 相信 软件 可 以 像 一 位 头发 斑 白 的 资深 DBA 一 样 工 作 呢 ?应 该 对 管理 软件 进行 配置 ， 以 便 它 可 以 提醒 
DBA 要 采取 什么 样 的 行动 。DBA 可 以 对 行动 进行 审查 ， 并 且 在 采取 纠正 措施 之 前 给 出 赞许 或 反对 的 意见 。 通 过 这 种 方式 ， 该 软 
件 可 以 赢得 DBA 的 尊重 和 信任 。DBA 信 任 某 个 软件 ， 就 会 使 用 它 ， 它 就 可 以 不 需要 DBA 的 干预 而 动态 自我 管理 了 。 但 今天 , 在 
大 多 数 情况 下 ，DBA 还 需要 设置 阐 值 ， 并 确保 其 持续 的 生存 能 力 。 


当然 ， 并 非 所 有 的 DBA 职 责 都 可 以 由 软件 自我 管理 。 大 多 数 自我 管理 声明 针对 的 是 性 能 管理 ， 但 是 ， 变 更 管理 会 是 什么 情 
况 呢 ?DBMS 不 能 以 某 种 方式 读 取 用 户 的 思想 并 添加 一 个 新 列 或 索引 ,或 者 变更 数据 的 类 型 和 长 度 。 这 个 非 平 几 的 活动 需要 一 名 
熟练 的 DBA 分 析 数 据 库 的 结构 、 制 定 修改 并 部 署 合适 的 脚本 或 工具 来 实施 变更 。 当 然 ， 软 件 可 以 帮助 简化 这 个 过 程 ， 但 软件 无 
法 蔡 代 DBA。 


并 非 所 有 的 DBA 职 责 都 可 以 由 软件 自我 管理 。 


此 外 ， 数 据 库 备份 和 恢复 将 需要 在 DBA 的 指导 下 进行 。 或 许 ，DBMS 可 以 变 得 足够 有 悟性 ， 可 以 在 系统 过 程 需要 时 安排 备 
份 。 也 许 将 来 有 足够 多 的 数据 变更 时 ，DBMS 会 自动 安排 备份 。 但 有 时 备份 是 出 于 其 他 原因 : 从 一 个 系统 到 另 一 个 系统 传播 变 
更 ; 作为 程序 测试 的 一 部 分 ; 建立 试验 平台 等 。 需 要 一 个 熟练 的 专业 人 士 来 建立 适当 的 备份 脚本 ， 然 后 适当 地 运行 它们 ， 并 测试 
备份 文件 的 准确 性 。 恢 复 又 是 如 何 进 行 的 ?损坏 的 数据 库 如 何 才 能 知道 它 需 要 进行 恢复 ”由 于 数据 库 已 损坏 ， 任 何 可 能 会 尝试 的 
自我 管理 的 恢复 都 自动 变 得 有 嫌疑 。 在 这 里 再 次 需要 DBA 的 智慧 和 知识 。DBA 可 以 依靠 自动 化 工具 来 简化 恢复 过 程 ， 但 没有 经 
验 丰富 的 DBA 的 指导 ， 工 具 本 身 无 法 执行 任务 。 


而 且 还 有 很 多 其 他 DBA 职 责 不 能 完全 自动 化 。 因 为 每 家 公司 不 同 ，DBMS 必 须 使 用 配置 参数 进行 定制 。 当 然 ， 你 可 以 选择 使 
用 开 箱 即 用 的 DBMS， 但 知识 丰富 的 DBA 配 置 DBMS， 使 其 适当 地 为 他 们 的 企业 运行 。 并 不 是 每 一 个 问题 都 是 可 以 由 开发 人 员 任 
借 “ 消 息 和 代码 ”手册 和 技术 支持 而 轻松 搞定 的 。 如 果 遇 到 | 特别 束 手 的 问题 ， 而 DBA 又 不 在 旁边 怎么 办 ? 


除 此 之 外 ， 自 动 化 应 该 是 数据 库 管 理 方程 所 需 的 一 个 组 件 。 自 动 化 日 常任 务 可 以 释放 出 更 多 的 时 间 ， 从 而 可 以 将 更 多 的 注意 
力 放 在 更 有 难度 的 任务 以 及 无 法 完全 实现 自动 化 的 任务 上 。 


244 知识 共享 


知识 传递 是 成 为 一 名 优秀 的 DBA 的 重要 组 成 部 分 ， 不 仅 要 将 你 的 知识 传递 给 其 他 人 ， 也 要 积极 参与 其 他 人 的 知识 传递 。 


你 了 解 得 越 多 ， 你 就 越 应 该 将 这 些 知识 分 享 给 其 他 人 。 许 多 本 地 的 数据 库 用 户 组 每 个 季度 或 每 个 月 都 有 会 面 ， 在 一 起 讨论 数 
据 库 管理 系统 的 方方面面 。 一 定 要 参加 这 些 会 议 ， 了 解 你 的 同行 都 在 做 什么 。 如 果 你 有 一 些 好 的 经 验 要 分 享 ， 可 以 放 到 一 个 演示 
文档 中 。 有 时 通过 演讲 学 到 的 远 远 比 只 是 参加 更 多 ， 因 为 所 有 的 与 会 者 都 会 找 你 讨论 你 的 方法 。 你 也 可 以 将 本 地 用 户 组 作为 一 个 
参加 国际 数据 库 用 户 组 会 议 的 跳板 ， 会 议 由 主要 用 户 组 协会 主持 ( 详 见 “主要 数据 库 用 户 组 协会 ”) 。 


主要 数据 库 用 户 组 协会 
每 个 主要 的 DBMS 都 有 用 户 组 协会 。 这 些 协会 主持 区 域 会 议和 国际 会 议 ， 并 为 数据 库 用 户 和 DBA 提 供 各 种 资源 。 
IDUG: 国际 DB2 用 户 组 。www.idug.org。 
HUG: 国际 Informix 用 户 组 。www.iiug.otgo 
IOUG: 独立 Oracle 用 户 组 。www.ioug.org。 
ISUG: 国际 Sybase 用 户 组 。www.isug.com。 
SQL Servet 专 业 协 会 。www.sqlpass.org。 
一 定 要 加 入 DBMS 的 协会 ， 这 样 你 就 可 以 使 用 并 利用 网 络 和 职业 提升 带 来 的 机 会 。 


另 一 种 共享 知识 的 途径 是 使 用 在 线 的 论坛 。 门 户 网 站 和 基于 网 络 的 出 版 物 都 在 不 断 为 各 自 的 网 站 寻找 内 容 。 试 着 将 一 些小 片 
段 或 文章 放 到 这 些 网 站 上 ， 有 助 于 整理 你 的 思绪 以 及 记录 你 的 经 验 。 此 外 ， 作 为 网 站 文章 或 专栏 的 作者 ， 你 可 以 接触 到 你 的 同 
行 。 有 时 ， 这 种 接触 可 以 帮助 你 得 到 梦 吹 以 求 的 工作 。 


另外 ， 你 还 应 参与 一 些 社交 网 站 ， 如 Facebook、Linkedln 和 Twitter。 每 一 个 社交 网 络 社区 都 可 以 推动 你 的 事业 进步 ， 并 添 
加 到 你 的 专业 网 络 。Facebook 适 合用 于 较 随 意 的 交互 ， 但 许多 数据 库 专业 人 员 的 参与 以 及 通过 Facebook 连 接 开 发 的 社区 有 助 
于 拓宽 交互 。Linkedln 更 为 专业 一 些 ， 用 于 同事 之 间 的 交流 ， 并 且 可 以 使 他 们 在 换 工 作 时 保持 联系 。Twitter 或 许 是 与 其 他 DBA 
交流 的 最 佳 方式 ， 可 以 分 享 各 自 的 故事 、 建 议 ， 以 及 更 多 。 详 见 “Twitter”。 


最 后 ， 如 果 你 有 时 间 ， 可 以 考虑 为 某 个 数据 库 相关 的 杂志 写 文 章 。 为 出 版 物 写 文 章 会 花 好 多 时 间 ， 但 这 可 以 带 给 你 最 大 的 曝 
光度 。 此 外 ， 一 些 期 刊 会 支付 你 稿费 。 

然而 ， 与 他 人 分 享 你 的 知识 的 最 好 理由 是 ， 你 希望 他 们 也 与 你 分 享 他 们 的 知识 和 经 验 。 这 种 合作 的 精神 维护 着 这 些 愿意 并 渴 
望 向 他 人 提供 援助 DBA 的 社区 。 

Twitter 

Twitter (www.twittercom) 的 基本 理念 很 简单 。 它 为 用 户 提供 了 一 个 平台 ， 使 他 们 可 以 每 次 发 布 不 超过 140 字 的 消息 。 这 看 
起 来 很 受 限制 ， 除 非 你 使 用 Twitter 一 段 时 间 。 当 你 发 布 一 个 微 博 ( 即 发 送 一 个 Twittet 消 息 ) 时 ， 它 可 以 广播 给 你 所 有 的 跟随 者 。 
同样 地 ， 当 你 跟随 的 任何 人 发 送 一 个 微 博 时 ， 它 都 会 广播 到 你 。 


例如 ， 你 可 以 在 Twitteft 上 通过 @ctraigmullins 跟 随 我 ， 我 会 在 博客 、 作 品 、 演 讲 等 地 方 共享 信息 。 在 Twitter 上 跟随 一 个 成 熟 的 
人 ， 可 以 通过 他 获得 新 闻 、 趋 势 、 问 题 和 想法 。 许 多 专业 的 DBA 都 参与 Twitter， 以 及 一 些 IT 界 的 和 名人， 如 Bi 让 
Gates (@BillGates) ~ Robert Scoble (@scobleizer) 和 Don Tapscott ((@dtapscott) 。 你 也 可 以 使 用 Twittet 跟 随 一 些 行业 分 析 师 ， 


包括 来 自 Red Monk、Gartner、IDC 和 Forrester 的 分 析 师 。 


你 还 可 以 给 跟随 你 的 其 他 人 发 送 私 聊 信息 。 这 可 以 在 发 送 那 些 不 需要 进一步 跟 进 或 附件 的 短 消息 时 ,减少 电子 邮件 的 使 用 。 
一 些 有 远见 的 公司 都 有 Twitter 客服 ， 时 刻 关注 着 推 的 数据 流 并 及 时 为 各 种 抱怨 、 评 论 和 建议 作出 回应 。 


参与 Twitter 时 ， 一 定 要 使 用 标签 。 标 签 是 一 个 前 面 加 了 字符 ## 的 术语 ， 如 #DBA。 标 签 可 以 作为 一 种 元 数据 ， 告 知 其 他 
Twittet 用 户 有 关 你 的 消息 的 内 容 。 


使 用 Twittert， 你 可 以 扩展 你 的 社交 网 络 ， 与 来 自 全 世界 的 DBA 交 流 。 


24.5 分析、 简化 和 专注 


正如 在 前 面 的 章节 中 了 解 到 的 ，DBA 的 工作 很 复杂 ， 跨 越 了 许多 不 同 的 技术 和 职能 领域 。 某 些 任务 很 容易 让 DBA 变 得 不 知 
所 措 ， 尤 其 是 那些 不 定期 执行 的 任务 。 在 一 个 复杂 、 异 构 、 分 布 式 的 世界 ， 很 难看 清楚 所 有 的 东西 。 最 好 建议 就 是 要 专注 ， 时 刻 
保持 清醒 的 头脑 。 


了 解 每 个 任务 的 目的 并 重点 执行 那些 可 以 帮助 你 达到 这 一 目的 的 步骤 。 除 非 无 法 避免 ,否则 一 定 不 要 为 了 个 别 任务 而 去 扩 宽 
工作 的 范围 。 换 句 话说 ， 切 勿 好 高 仪 远 。 如 果 一 些 室 不 相干 的 目标 组 合 在 一 起 ， 很 容易 导致 长 时 间 的 工作 却 看 不 到 结束 的 迹象 。 


我 不 是 说 DBA 应 该 (必须 ) 划分 到 一 个 特殊 的 领域 (如 性 能 ) 。 我 的 建议 是 每 个 任务 应 给 予 适当 的 关注 级 别 和 注重 细节 。 
当然 ,我 不 建议 你 不 去 执行 多 个 任务 。 成 功 的 DBA 能 够 在 执行 多 任务 的 同时 还 能 充分 注意 到 每 个 任务 ， 如 同 正在 处 理 的 任务 。 


关注 的 政 人 是 什么 ? 有 许多 敌人 ， 如 注意 力 分 散 、 缺 乏 知 识 、 管 理 以 及 经 常 担心 接 下 来 要 尝试 或 做 的 事情 。 注 意 力 分 散 可 能 
会 对 需要 深 谋 远 虑 和 注重 细节 的 任务 造成 严重 的 破坏 。 


分 析 、 简 化 和 专注 。 只 有 这 样 ， 任 务 才 将 变 得 可 以 衡量 并 且 更 容易 实现 。 
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冷静 的 性 格 以 及 能 够 在 艰苦 的 条 件 下 保持 冷静 是 成 为 一 名 好 的 DBA 的 关键 。 问 题 总 会 出 现 ， 没 有 办 法 消除 每 一 个 可 能 的 问 
题 或 错误 。 作 为 DBA， 你 工作 的 一 部 分 就 是 能 够 用 平静 的 神态 和 善于 分 析 的 性 格 对 问题 作出 反应 。 


当 数 据 库 出 现 故 障 并 且 应 用 程序 不 可 用 时 ， 你 的 工作 将 会 变 得 忙碌 又 疲 惫 。 出 现 问题 时 你 可 以 做 的 最 好 的 事情 是 保持 冷静 ， 
并 利用 广博 的 知识 和 培训 。 作 为 DBA， 在 数据 库 和 应 用 程序 恢复 正常 之 前 ， 你 将 是 整个 公司 (或 者 至 少 是 受 影响 的 部 门 ) 关注 
的 焦点 。 你 的 老板 和 你 的 用 户 在 身后 徘徊 监督 着 你 ,会 是 一 种 惨痛 的 经 历 。 一 定 要 有 心理 准备 ， 因 为 这 种 事情 终 会 发 生 。 惊 慌 失 
措 可 能 会 导致 人 工 操作 错误 ， 恐 怕 你 最 不 愿意 看 到 的 就 是 从 一 个 错误 中 恢复 。 


惊慌 可 能 会 导致 人 工 操 作 错 误 。 


你 的 计划 越 全 面 ， 程 序 越 好 ， 问 题解 决 得 就 越 快 。 此 外 ， 如 果 你 对 你 的 程序 有 信心 ， 你 就 越 能 保持 冷静 。 


24.7 ”测量 两 次 ， 切 割 一 次 
正在 准备 是 指 对 你 的 DBA 的 政策 和 程序 进行 分 析 、 记 录 和 测试 。 未 经 测试 创建 的 程序 对 你 运作 高 效 的 数据 库 环境 的 帮助 很 
小 。 此 外 ， 它 不 会 使 你 在 面 对 问题 时 迅速 有 效 地 作出 反应 。 


古训 道 : 测量 两 次 ,切割 一 次 。 至 于 DBA 的 程序 ， 这 意味 着 分 析 、 测 试 ， 然 后 再 应 用 。 分 析 你 的 环境 以 及 对 数据 库 的 业务 
需求 ， 创 建 可 以 满足 这 些 需求 的 程序 和 政策 ， 测 试 这 些 程序 ， 并 将 其 应 用 到 生产 数据 库 中 。 


24.8 ”了解 业务 ,不 只 是 技术 


请 记 住 ， 技 术 娴 熟 只 是 成 为 一 名 优秀 的 DBA 的 一 部 分 。 昌 然 技 术 很 重要 ， 了 解 你 的 业务 需求 也 很 重要 。 如 果 不 了 解 你 所 管 
理 的 数据 库 对 业务 的 影响 ， 你 只 会 盲目 地 使 用 技术 ， 毫 无 目的 可 言 。 


业务 需求 必须 决定 什么 样 的 技术 应 用 到 什么 数据 库 ， 以 及 哪些 应 用 程序 。 使 用 最 新 和 最 伟大 的 (和 最 昂贵 的 ) 技术 和 软件 可 
能 会 很 有 趣 ， 技 术 上 更 具 挑 战 性 ， 但 它 可 能 不 是 你 实施 的 每 一 个 数据 库 所 必需 的 。DBA 的 工具 和 实用 程序 需要 与 业务 策略 和 措 
施 捆绑 在 一 起 。 这 样 ，DBA 的 工作 就 与 企业 的 目标 和 业务 成 为 一 体 。 

实现 这 一 协同 工作 的 第 一 步 是 整合 DBA 服 务 与 T 基 础 设施 等 核心 部 件 。 当 然 ，DBA 应 该 能 够 对 其 职责 范围 内 的 数据 库 进 行 监 
测 和 控制 ， 但 同时 也 应 该 能 够 对 更 广泛 的 范围 内 的 |T 基 础 设施 进行 监测 ， 包 括 系统 、 应 用 程序 、 存 储 和 网 络 。 


DBA 应 该 能 够 对 其 职责 范围 内 的 数据 库 进行 监测 和 控制 。 


DBA 应 该 能 够 在 工作 中 洞察 到 业务 的 自然 循环 。IT 基 础 设施 其 他 部 分 的 开发 人 员 和 管理 员 将 不 会 对 每 天 、 每 周 、 每 季度 或 每 
年 中 最 繁忙 的 时 候 有 远见 ， 因 为 他 们 不 熟悉 公司 业务 功能 的 实际 数据 流量 。 但 作为 DBA 工 作 的 一 部 分 ， 你 可 以 接触 到 这 些 信 
息 。 因 此 被 赋予 了 理解 业务 周期 信息 的 权力 ， 并 将 这 些 信息 应 用 在 工作 中 。 


DBA 需 要 进一步 利用 其 在 基础 设施 中 的 特殊 地 位 。 与 终端 用 户 交谈 (不 只 是 应 用 程序 开发 人 员 ) ， 充 分 了 解 在 实施 任何 数 
据 库 设计 之 前 他 们 如 何 使 用 数据 库 。 了 解数 据 库 对 公司 底线 的 影响 ， 以 便 在 生产 中 发 生 不 可 避免 的 问题 时 ， 你 会 记得 某 些 数据 不 
可 用 会 对 实际 的 业务 产生 的 影响 。 同 时 ， 你 也 可 以 创建 程序 ， 最 大 限度 地 减少 此 类 问题 的 发 生 。 


为 了 履行 业务 /IT 整 合 的 承诺 ， 使 商业 服务 与 底层 技术 联系 起 来 很 有 必要 。 例 如 ， 技 术 人 员 应 该 能 够 立刻 明白 PRD2 环 境 中 交 
易 X7R2 的 服务 中 断 意 味 着 区 域 性 活期 存款 客户 无 法 访问 自己 的 账户 。 看 到 区 别 了 吧 ? 


专注 于 交易 、TP 监 视 器 和 数据 库 是 DBA 工 作 的 核心 。 但 是 ， 服 务 客户 是 DBA 建 立 这 些 数据 库 以 及 管理 这 些 交 易 的 原因 。 了 
解 技术 决策 会 对 业务 产生 影响 的 技术 人 员 ， 服 务 业务 策略 的 工作 也 会 做 得 更 好 。DBA 经 理 更 是 如 此 ， 能 够 用 业务 术语 说 话 的 技 
术 经 理 对 公司 更 有 价值 。 


当然 ， 许 多 问题 都 隐藏 在 细节 中 。DBA 实 现 有 效 的 业务 /IT 整合 的 一 个 关键 组 成 部 分 是 能 够 将 具体 的 技术 与 具体 的 业务 服务 
联系 起 来 。 这 需要 服务 影响 管理 能 力 ， 也 就 是 说 ， 分 析 每 一 次 执行 关键 业务 服务 所 需 的 技术 并 记录 其 中 的 联系 。 人 存在 某 些 技术 ， 


通过 事件 自动 化 和 服务 建 模 可 以 将 一 些 工作 实现 自动 化 。 这 种 能 力 有 助 于 将 可 用 性 和 性 能 数据 转换 成 对 业务 服务 的 状态 和 服务 水 
平 协议 的 详细 了 解 。 


当今 的 现代 企业 需要 可 以 认识 到 管理 决策 会 对 业务 产生 影响 的 技术 人 员 。 因 此 ，DBA 需 要 使 自己 变 得 更 加 熟悉 业务 。 也 就 
是 说 ， 他 需要 时 刻 关 注 着 其 控制 范围 内 的 技术 对 业务 的 影响 。 


企业 需要 可 以 认识 到 管理 决策 会 对 业务 产生 影响 的 技术 人 员 。 


249 ”不 要 成 为 隐士 


与 应 用 程序 开发 人 员 一 起 合作 。 不 要 将 自己 孤立 在 一 个 小 小 的 DBA 角 落 。 越 了 解 应 用 程序 的 用 途 和 需求 ， 就 越 能 更 好 地 调 
整数 据 库 来 支持 这 些 应 用 程序 。 


DBA 应 该 是 容易 接近 的 ， 不 要 害怕 与 陌生 人 接触 。 公 司 越 看 重 你 的 专长 和 可 用 性 ， 你 对 公司 就 越 有 价值 。 


容易 接近 。 


24.10 ”任意 使 用 所 有 的 资源 


请 记 住 ， 你 不 必 做 所 有 的 事情 。 你 可 以 任意 使 用 所 有 的 资源 。 前 面 讨论 过 一 些 资 源 ， 如 文章 和 书籍 、 网 站 和 脚本 、 用 户 组 和 
会 议 。 但 还 有 其 他 的 资源 。 


当 你 完全 被 难 倒 时 ， 就 不 要 与 问题 死 碎 了 。 在 有 些 DBA 的 观念 里 ， 他 们 必须 自己 解决 每 一 个 问题 才能 取得 成 功 。 有 时候, 
你 只 需要 知道 去 哪里 寻求 帮助 来 解决 这 个 问题 。 使 用 DBMS 供 应 商 的 技术 支持 ， 以 及 DBA 工 具 供 应 商 的 技术 支持 热线 。 对 于 你 经 
验 不 足 的 领域 可 以 咨询 其 他 内 部 资源 ， 例 如 ， 网 络 与 连接 问题 可 以 咨询 网 络 专家 ， 操 作 系统 和 系统 软件 问题 咨询 系统 管理 员 ， 授 
权 和 保护 问题 咨询 安全 管理 员 。 


知道 去 哪里 寻求 帮助 来 解决 问题 。 


当 加 入 一 个 用 户 组 时 ， 建 一 个 DBA 同 事 的 网 络 ， 在 需要 帮助 时 可 以 联系 他 们 。 很 多 时 候 ， 令 你 烦恼 不 已 的 问题 正 是 别人 已 
经 遇 到 并 解决 的 问题 。 一 个 可 以 求助 的 DBA 网 络 是 一 种 非常 宝贵 的 资源 (并 且 ， 你 公司 没有 人 会 知道 问题 不 是 你 自己 解决 
的 ) 。 


最 后 ， 一 定 要 了 解 你 的 DBMS 供 应 商 提供 的 可 用 资源 。DBMS 供 应 商 为 他 们 的 客户 提供 大 量 有 用 的 信息 。 所 有 的 DBM S 供 应 
商会 在 他 们 的 网 站 上 提供 软件 支持 。 其 中 有 许多 还 专门 提供 了 一 个 数据 库 ， 供 用 户 搜索 查找 各 种 数据 库 问题 。1BM 用 户 可 以 使 用 
IBMLink [1]，Oracle 和 Microsoft 则 在 各 自 网 站 的 技术 支持 部 分 提供 了 可 搜索 的 数据 库 。 一 些 DBA 声 称 通过 在 线 数据 库 ，95% 或 
更 多 的 问题 都 可 以 解决 。 这 些 资 源 可 以 大 大 减少 解决 问题 所 需 的 时 间 ， 尤 其 是 如 果 DBMS 供 应 商 宣 称 他们 会 “终生 ”为 你 分 忧 。 


当然 ， 每 个 DBA 都 还 应 该 配备 DBMS 供 应 商 的 技术 支持 电话 号 码 ， 遇 到 | 特别 难 解决 的 问题 时 可 以 求助 。 一 些 支持 是 按 通 话 付 
费 的 ， 而 另 一 些 则 按 预 付费 支持 合同 。 在 打 给 DBMS 供 应 商 之 前 ， 一 定 要 知道 你 的 公司 是 如 何 付费 的 。 否 则 ， 可 能 会 导致 重大 支 
持 费 用 。 


[1] IBMLink 是 一 种 IBM 只 为 其 客户 开放 的 专 有 网 络 。 


24.11 不 断 更 新 


不 断 更 新 技术 。 确 保 知道 在 用 的 DBMS 的 所 有 特点 与 功能 (至少 在 一 个 很 高 的 水 平 ， 但 最 好 是 深入 了 解 ) 。 阅 读 供应 商 天 于 
未 来 版 本 的 文献 ， 新 版 本 可 用 时 你 可 以 很 快 准备 新 的 功能 ， 然 后 安装 并 迁移 到 新 的 DBM 版 本 。 越 早 知道 新 的 功能 ， 就 越 能 更 好 
地 编写 新 的 程序 并 采取 新 的 政策 来 支持 这 些 新 功能 。 


不 断 更 新 一 般 的 技术 。 例 如 ，DBA 应 该 了 解 与 数据 相关 的 新 技术 (如 NoSQL) ， 而 且 还 要 了 解 其 他 与 数据 库 系统 交互 的 新 
技术 。 不 要 仅 因 为 你 不 能 立刻 想到 与 数据 库 相 关 的 影响 就 忽视 某 些 行业 和 技术 趋势 。 许 多 原本 与 数据 库 无 关 的 事物 (如 XML) 
最 终 在 DBMS 软 件 和 数据 库 应 用 程序 中 找到 了 出 路 。 


不 断 更 新 行业 标准 ， 尤 其 是 那些 影响 数据 库 技 术 的 标准 (如 SQL) 。 在 某 些 标准 产生 的 新 功能 纳入 DBMS 之 前 了 解 这 些 标 
准 ， 将 使 你 具有 DBMS 管 理 方面 的 优势 。DBMS 供 应 商 试 图 支持 行业 标准 ， 并 且 由 于 许多 功能 采取 了 某 个 行业 标准 而 进入 DBMS 


一 般 的 技术 和 行业 标准 都 要 不 断 更 新 。 


正如 已 经 讨论 过 的 ， 保 持 一 种 最 新 的 方式 是 参加 本 地 和 国家 用 户 组 。 这 些 论坛 上 发 表 的 演示 都 很 有 教育 意义 。 更 为 重要 的 
， 有 机 会 与 其 他 DBA 分 享 经 验 并 借鉴 彼此 的 项 目 。 


fill 


参加 本 地 和 国家 数据 库 用 户 组 。 


通过 明智 地 使 用 互联 网 和 Web，DBA 比 以 往 更 容易 保持 最 新 。 许 多 有 用 的 信息 网 站 提供 论坛 、 脚 本 库 、 文 章 、 手 册 和 人 入门 
文档 。DBA 关 注 的 网 络 资源 列表 请 参见 附录 D。 不 过 ， 请 记 住 ， 这 仪 是 个 开始 。 


24.12 投资 自己 


大 多 数 上 T 专 业 人 员 都 在 不 断 寻找 机 会 让 公司 为 其 持续 教育 投资 。 谁 不 希望 在 工作 时 间 用 公司 的 钱 学 到 新 的 东西 ”除非 你 是 
BA. 


是 的 ， 你 的 公司 应 投入 一 定 的 资金 用 于 培训 新 的 技术 和 能 力 ， 尤 其 是 让 你 做 新 东西 的 公司 。 而 且 ， 由 于 技术 的 变化 如 此 之 
快 ， 几 乎 每 个 人 每 年 的 某 些 时 候 都 必须 学 习 新 的 东西 。 但 是 学 习 的 投资 不 应 完全 由 公司 承担 。 


安排 一 些 预算 投资 自己 的 事业 。 毕 竟 ， 你 的 整个 职业 生涯 不 可 能 都 为 同一 家 公司 工作 。 为 什么 要 强迫 你 的 公司 为 你 一 生 的 持 
续 教 育 提供 资金 ”我 知道 这 在 很 大 程度 上 取决 于 你 的 特殊 情况 。 曾 经 ， 由 于 公司 所 提供 的 “特殊 待遇 ”， 我 们 才 愿 意 接受 比 我 们 
所 期 望 的 工资 更 低 的 工资 。 这 些 特殊 待遇 之 一 就 是 可 以 参加 培训 |。 

安排 一 些 预算 投资 自己 的 事业 。 


但 是 ， 一 些 人 痛恨 将 自己 辛苦 挣 来 的 钱 花 在 提升 他 们 的 事业 上 。 尽 管 如 此 ， 用 一 点 钱 买 一 些 新 书 ， 订 购 一 种 期 刊 或 加 入 一 个 
专业 组 织 应 该 是 大 多 数 DBA 都 可 以 做 到 的 。 


愿意 花 一 些 钱 与 技术 保持 同步 符合 DBA 的 特点 。 大 多 数 DBA 具 有 永 不 满足 的 好 奇 心 ， 他 们 中 很 多 都 愿意 投资 学 习 。 也 许 他 
们 是 公司 中 最 先 购买 XML 书籍 的 人 。 在 他 们 小 隔 间 的 书架 上 摆 满 了 各 种 数据 库 书籍 ， 很 令 人 羡慕 。 或 者 他 们 会 象征 性 地 付 一 点 
费用 ， 订 阅 SQL Server 门 户 网 站 会 员 专 有 的 内 容 。 他 们 甚至 会 支付 10 美 元 去 参加 本 地 用 户 组 。 


别 误解 了 我 的 意思 。 我 不 是 说 公司 不 应 该 报销 这 些 费 用 。 他 们 应 该 ， 因 为 这 可 以 为 他 们 提供 更 全 面 、 受 教育 更 多 以 及 更 有 价 
值 的 雇员 。 但 是 如 果 你 的 老板 不 愿意 为 你 认为 对 事业 有 帮助 的 事情 买单 ， 那 么 为 什么 不 自己 为 自己 买单 呢 ? 


一 定 要 记录 下 这 些 花 费 ， 因 为 未 报销 的 业务 费用 可 以 抵 税 。 


24.13 We 


DBA 的 工作 充满 了 挑战 ， 无 论 从 技术 角度 还 是 政治 角度 。 遵 循 本 章 提供 的 经 验 法 则 ， 可 以 增加 DBA 成 功 的 可 能 性 。 


24.14 ”最 后 的 检验 


1. 在 一 个 较 高 的 层面 ， 讨 论 DBA 的 主要 工作 职责 。 

2 一 个 有 认证 的 DBA 一 定 是 一 个 合格 的 DBA 吗 ? AA? 

3. 为 什么 DBA 必 须要 准备 成 为 一 个 多 面 手 ? 

4. 为 什么 应 该 实施 数据 库 标 准 ， 缺 乏 DBA 标 准 与 程序 会 有 什么 风险 ? 
5. 请 说 出 TPC 基 准 的 名 称 ， 并 描述 它们 之 间 有 什么 区 别 。 

6. 请 说 出 安装 新 的 DBM S 时 必须 要 规划 的 五 种 需求 。 

7. 概 念 数据 模型 与 逻辑 数据 模型 之 间 的 区 别 是 什么 ? 

8. 为 什么 说 数据 建 模 对 数据 库 的 开发 很 重要 ? 

9. 请 从 广义 上 描述 规范 化 的 目标 。 

10. 实 体 与 实体 实例 之 间 的 区 别 是 什么 ? 

11. 每 一 个 属性 做 三 件 事情 中 的 一 件 ， 命 名 这 些 事情 并 予以 摘 述 。 
12. 使 物理 数据 模型 非 规范 化 的 唯一 理由 是 什么 ? 

13. 在 什么 情况 下 ， 你 应 考虑 使 用 位 图 索引 而 不 是 b-tree 索 引 ? 

14. 请 描述 一 个 关系 数据 库 是 如 何 使 用 索引 的 。 


15. 为 什么 表 的 列 的 创建 顺序 对 物理 数据 库 设计 很 重要 ? 


16. 如 果 索 引 对 性 能 有 益 ， 为 了 安全 起 见 ， 为 什么 不 创建 所 有 可 能 的 索引 ? 

17. 请 描述 缩写 ACID 的 意思 ， 并 定义 每 一 个 组 件 。 

18 .为 什么 加 锁 以 保证 数据 的 完整 性 ? 

19. 关 联 式 闭 包 的 意思 是 什么 ? 其 在 应 用 程序 设计 中 有 什么 重要 性 ? 

20. 锁 超时 与 死 锁 之 间 的 区 别 是 什么 ? 

21. 为 什么 除了 审查 SQL 之 外 ， 审 查 应 用 程序 代码 也 很 重要 ? 

22. 请 列举 几 个 说 明 在 设计 审查 中 要 包括 应 用 程序 开发 管理 人 员 的 代表 的 原因 。 
23. 为 什么 DBA 应 该 领导 大 多 数 设计 审查 ? 

24. 为 什么 向 一 个 表 的 两 个 已 有 的 列 中 间 添 加 新 列 很 困难 ? 

25. 请 解释 级 联 式 drop 的 意思 

26. 如 果 你 必须 删除 整个 数据 库 来 影响 某 个 数据 库 变更 ， 其 他 哪些 数据 库 结 构 也 会 被 DBMS 自 动 删除 ? 
27. 请 给 出 可 用 性 的 定义 。 

28. 造 成 非 计划 性 停 运 的 常见 原因 是 什么 ? 

29. 什 么 是 非 破坏 性 的 数据 库 实 用 程序 ”为 什么 说 它们 对 于 维护 数据 库 的 可 用 性 很 重要 ? 
30. 请 给 出 数据 库 性 能 的 定义 。 

31. 在 数据 库 应 用 程序 调整 中 需要 解决 的 三 件 “ 事 情 ” 是 什么 ? 
32.80/20 规 则 是 什么 意思 ? 它 如 何 应 用 到 数据 库 应 用 程序 的 性 能 调整 中 ? 

33. 根 据 大 多 数 专 家 的 说 法 ， 导 致 数据 库 应 用 程序 性 能 问题 的 最 主要 原因 是 什么 ? 
34 .数据 高 速 缓存 (或 缓冲 池 ) 是 如 何 提升 数据 库 处 理性 能 的 ? 

35. 为 什么 某 些 数据 库 操作 不 会 被 记录 ? 

36. 通 过 将 优化 的 SQL 缓存 在 内 存 中 有 什么 好 处 ? 

37. 数 据 库 事务 日 志 中 记录 了 什么 类 型 的 信息 ? 

38.DBA 用 来 提升 数据 库 性 能 的 最 好 的 性 能 调 优 技术 是 什么 ? 

39. 集 群 数据 的 优势 是 什么 ? 

40. 什 么 导致 了 数据 库 和 索引 的 混乱 ? 

41. 为 表 空 间 和 索引 分 配 单独 的 磁盘 设备 有 什么 好 处 ? 


2. 请 给 出 物理 数据 独立 性 的 定义 。 


43. 在 SQL 访问 路 径 选 择 过 程 中 ， 哪 些 因素 会 对 优化 程序 产生 影响 ? 

44. 请 说 出 两 种 主要 的 关系 连接 方法 ， 并 分 别 予以 描述 。 

45. 在 什么 情况 下 表 扫 描 胜 过 索引 访问 ? 

46. 请 给 出 实体 完整 性 的 定义 。 

47. 请 详细 说 明 数 据 库 结构 完整 性 与 语义 数据 完整 性 之 间 的 区 别 。 

48. 主 码 约束 与 唯一 约束 之 间 有 什么 区 别 ? 

49. 请 说 出 DBA 可 能 会 遇 到 的 四 种 数据 库 结构 完整 性 问题 ， 并 分 别 予以 描述 。 

50. 请 说 出 用 视图 来 实施 数据 安全 的 两 种 方式 。 

51. 哪 两 个 SQL DCL 语 句 可 以 用 来 构建 并 删除 数据 库 特权 ? 

52. 什 么 是 级 联 式 REVOKE? 它 会 对 数据 库 安全 有 什么 影响 ? 

53. 给 PUBLIC 授 予 特权 会 有 什么 影响 ? 

54. 为 什么 说 使 用 安全 机 制 保护 DBMS 外 部 的 一 些 数据 库 资源 很 重要 ? 

55. 请 描述 SQL 注 入 攻击 的 工作 方式 。 

56. 请 解释 创建 数据 库 操 作 的 审计 跟踪 的 用 途 。 

57. 请 描述 数据 屏 菩 ， 并 和 解释 它 如 何 有 利于 合 规 性 。 

58. 为 什么 停顿 点 对 时 间 点 恢复 很 重要 ? 

59. 哪 些 因素 可 以 确定 数据 库 对 象 应 该 采用 完整 的 或 增 量 的 映像 副本 备份 ? 

60. 请 说 出 三 种 可 能 需要 进行 恢复 的 数据 库 故障 ， 并 予以 描述 。 

61. 请 说 出 不 同类 型 的 恢复 的 名 称 ， 并 分 别 讨论 执行 各 个 类 型 在 恢复 时 会 受到 哪些 因素 的 影响 。 
62. 请 从 数据 库 管理 的 角度 对 灾难 进行 描述 。 

63. 为 灾难 恢复 计划 确定 数据 库 对 象 的 临界 时 ， 应 考虑 哪些 因素 ? 

64 一 旦 灾难 恢复 计划 制定 完成 ， 就 不 能 再 修改 。 这 种 说 法 正确 与 否 ? 

65. 为 什么 大 多 数 的 数据 库 文件 都 存储 在 磁盘 设备 上 而 不 是 其 他 存储 媒介 ? 

66. 如 果 你 的 企业 已 经 决定 购买 RAID 阵 列 来 支持 DBMS， 你 会 推荐 哪些 等 级 的 RAID? 为 什么 ? 
67.SAN 胜 过 SCSI 设 备 的 优势 是 什么 ? 

68 .计算 存储 一 个 表 所 需 的 存储 量 ， 如 同 将 一 行 中 各 列 的 字 节 数 加 起 来 再 将 所 有 行 的 和 相 乘 一 样 简单 。 这 种 说 法 正确 与 否 ? 


69. 对 同一 个 工作 单元 内 两 个 位 置 的 数据 进行 修改 时 ， 两 阶段 的 COMMIT 很 有 必要 ， 为 什么 ? 


70. 分 布 式 数据 库 系 统 高 效率 性 能 的 最 大 威胁 是 什么 ? 

71. 复 制 与 传播 之 间 有 什么 区 别 ? 

72 .数据 仓库 与 数据 集 市 之 间 有 什么 区 别 ? 

73. 因 为 数据 仓库 是 只 读 环境 ， 是 否 还 有 必要 为 它 指定 一 份 备份 与 恢复 计划 ? 
74. 请 详细 描述 星 型 模式 ， 为 什么 说 这 种 设计 对 数据 仓库 、 数 据 库 很 有 效 ? 
75.DBA 在 管理 互联 网 数据 库 时 会 遇 到 的 最 大 挑战 是 什么 ? 

76. 四 种 类 型 的 JDBC 数 据 库 驱 动 之 间 有 什么 区 别 ? 

77. 什 么 是 元 数据 ? 为 什么 它 很 重要 ? 

78. 请 说 出 三 个 类 别 的 性 能 工具 的 名 称 ， 并 简单 概括 它们 可 以 提供 的 典型 能 力 。 
79. 请 描述 在 时 态 数据 库 系 统 中 ， 系 统 时 间 与 业务 时 间 之 间 的 区 别 。 


80. 如 果 管 理 人 员 让 你 制定 DBA 工 具 的 合理 成 本 ， 你 如 何 尽量 减少 制定 的 工作 量 ? 


附录 A 数据库 基本 原理 


这 本 书 的 读者 应 该 都 了 解 了 数据 库 技术 的 基本 概念 和 基本 原理 。 然 而 ,很 多 人 认为 自己 了 解 基础 知识 ， 但 往往 并 不 真 的 了 
解 。 因 此 ， 本 附录 给 出 数据 库 管理 系统 基本 原理 的 非常 简短 的 介绍 。 


A.1 什么 是 数据 库 


什么 是 数据 库 ? 这 一 问题 的 答案 可 能 会 让 一 些 读者 吃惊 。Oracle 不 是 一 种 数据 库 ，DB2 或 SQL Server 也 不 是 。 它 们 都 是 
DBMS， 即 数据 库 管 理 系统 。 你 可 以 使 用 Oracle、DB2 或 SQL Server 创 建 一 个 数据 库 ， 但 它们 本 身 并 不 是 数据 库 。 许 多 人 (Bp 
使 是 高 技能 的 专业 人 士 ) 都 会 将 总 体系 统 (DBMS) 和 创建 的 系统 (数据库) 混淆 。 


那么 ,什么 是 数据 库 呢 ?数据 库 是 一 套 结构 化 的 持久 性 数据 。 电 话 簿 就 是 一 个 数据 库 。 然 而 ， 在 IT 的 世界 ， 数 据 库 通 常 是 与 
软件 关联 在 一 起 的 。 一 个 简单 的 数据 库 可 看 作 一 个 包含 许多 条 记录 的 文件 ， 其 中 每 条 记录 都 包含 一 组 相同 的 字段 ， 而 每 个 字段 又 
包含 数据 类 型 和 数据 长 度 。 总 之 ,数据库 是 一 个 有 组 织 的 数据 存储 ， 其 中 的 数据 可 以 通过 数据 元 素 名 称 访问 。 


数据 库 是 一 个 有 组 织 的 数据 存储 ， 其 中 的 数据 可 以 通过 数据 元 素 名 称 访问 。 


DBMS 是 一 个 用 来 创建 、 存 储 和 管理 数据 库 的 软件 包 。DBMS 软 件 使 终端 用 户 或 应 用 程序 员 之 间 可 以 共享 数据 。 它 提供 了 在 
数据 库 中 创建 、 更 新 、 检 索 和 存储 信息 的 系统 方法 。 数 据 的 完整 性 、 数 据 的 访问 控制 、 自 动 回 滚 、 重 新 启动 和 恢复 通常 由 DBMS 


你 可 以 把 数据 库 视 作 一 个 文件 夹 ， 而 DBMS 则 是 存放 这 些 有 标记 的 文件 夹 的 文件 柜 。 实 施 和 访问 数据 库 实 例 都 靠 DBMS。 薪 


金 应 用 程序 会 使 用 薪金 数据 库 ， 要 实现 该 数据 库 要 使 用 DBMS， 如 IMS、DB2、Oracle Database 12g 或 SQL Server, 


为 什么 这 种 区 别 很 重要 ”如 果 在 工作 场所 不 使 用 精确 的 术语 可 能 会 引起 混淆 ， 从 而 导致 项 目 超出 预算 ， 系 统 开发 不 正确 ， 以 
及 生产 力 受 到 损失 。 因 此 ， 精 确 很 重要 。 


A2 为 什么 使 用 DBMS 
使 用 DBMS 的 主要 优势 是 可 以 给 数据 添加 一 个 逻辑 的 、 结 构 化 的 组 织 。DBM SS 为 处 理 大 量 的 数据 提供 了 规模 上 的 经 济 性 ， 
为 它 为 这 样 的 操作 进行 了 优化 。 


可 以 根据 DBMS 中 的 数据 模型 对 其 进行 区 分 。 数 据 模 型 是 用 来 描述 数据 的 概念 集 。 一 个 数据 模型 有 两 个 基本 组 成 部 分 : 它 
的 结构 ， 即 数据 的 存储 方式 ; 它 的 操作 ， 即 操作 数据 的 方式 。 主 要 的 DBMS 产 品 使 用 四 种 不 同 的 数据 模型 : 


有 四 种 DBMS 数 据 模型 : 层次 、 网 络 、 关 系 和 面向 对 象 。 
- M% (或 CODASYL) ; 

BR; 

RR; 

:面向 对 象 。 


网 络 数据 模型 包括 一 个 记录 类 型 的 集合 ， 以 及 这 些 记 录 类 型 之 间 的 关系 。 所 有 的 关系 显 式 指定 ， 并 且 作为 DBM S 结 构 的 一 部 
分 进行 存储 。 网 络 模型 的 另 一 个 常见 的 名 称 叫 做 CODASYL。CODASYL 来 自 于 数据 系统 语言 会 议 (Conference on Data 
System Languages) ， 该 委员 会 在 20 世 纪 70 年 代 初 制定 了 这 种 模型 。 使 用 给 定 记录 的 位 置 并 按照 相关 记录 的 链接 对 数据 进行 
操作 。1IDM S 是 一 个 基于 网 络 模型 的 DBM S 的 例子 。 


层次 数据 模型 将 数据 排列 为 结构 树 ， 人 存储 在 较 低 的 层次 的 数据 从 属于 较 高 层次 的 数据 。 层 次 数据 模型 基于 有 额外 限制 的 网 络 
模型 (对 记录 的 访问 只 有 一 种 方式 ) 。1M 9 就 是 基于 层次 模型 的 DBM 产品 。 
关系 数据 模型 由 表 (更 恰当 地 说 ， 关 系 ) 的 集合 组 成 ， 表 中 的 列 定义 了 表 之 间 的 关系 。 关 系 模型 基于 数学 的 理论 集 。 与 通常 


的 看 法 相反 ， 关 系 模型 并 非 根据 “relationships” 命 名 ， 而 是 根据 数学 的 集合 理论 。 关系 是 一 组 无 重复 值 的 集合 。 数 据 的 操作 方 
式 有 好 多 种 ， 但 最 常见 的 方式 是 通过 SQL。DB2、Oracle 和 SQL Server 都 是 基于 关系 模型 的 DBM SS 产品 。 


面向 对 象 (OO) 的 数据 模型 包含 实体 或 对 象 的 集合 ， 其 中 每 个 对 象 都 包括 该 对 象 所 有 的 动作 。 换 名 话说， 对 象 封 装 了 数据 
和 过 程 。 有 了 OO 系统 ， 通 常 要 使 用 OO 编程 语言 对 数据 进行 操作 。Process Software 的 ObjectSstore 和 Intersystem 的 Cache 都 
是 基于 OO 模型 的 DBM S 产 品 。 


为 了 简单 起 见 ， 这 四 种 数据 模型 都 称 为 数据 模型 。 在 现实 中 ， 只 有 关系 和 网 络 模 型 有 真正 的 、 正 式 的 数据 模型 规范 。 不 同 的 
数据 模型 会 导致 不 同 的 逻辑 和 结构 数据 组 织 。 关 系 模型 是 最 流行 的 数据 模型 ， 因 为 它 是 最 抽象 、 最 简单 的 数据 应 用 ， 同 时 提供 强 
大 的 数据 操作 和 访问 能 力 。 


今天 ， 关 系 是 最 商业 化 的 DBMS 实 施 。 


使 用 DBMS 的 优势 


此 外 ，DBMS 提 供 了 数据 的 集中 存储 ， 可 以 由 多 个 用 户 从 多 个 位 置 进行 访问 。 数 据 可 以 在 多 个 应 用 程序 之 间 共 享 ， 不 需要 进 
行 传播 ， 再 存储 在 每 一 个 新 应 用 程序 的 新 文件 中 。DBMS 内 的 数据 集中 存储 和 管理 可 以 提供 : 


> 数据 抽象 和 数据 独立 性 ， 
“ 数据 安全 ，; 
. 并 发 访问 的 锁 机 制 ; 
- 高 效 的 处 理 程序 ， 平 衡 使 用 相同 数据 的 多 个 应 用 程序 ; 
- 迅速 从 前 溃 和 错误 中 恢复 的 能 力 ; 
: 强大 的 数据 完整 性 功能 ; 
. 使 用 标准 的 API 进 行 简 单 访问 ; 
: 统一 的 数据 管理 程序 。 
数据 抽象 的 级 别 


DBMS 提 供 了 单个 数据 库 模式 的 多 种 视图 。 视 图 定义 了 用 户 可 以 看 到 什么 样 的 数据 以 及 如 何 看 到 。DBMS 提 供 了 介 于 概念 模 
式 和 物理 模式 之 间 的 抽象 级 别 ， 概 念 模式 定义 数据 库 的 逻辑 结构 ， 物 理 模式 描述 文件 、 索 引 以 及 数据 库 使 用 的 其 他 物理 机 制 。 用 
户 作 用 在 概念 级 别 (例如 ， 查 询 表 各 行 的 列 ) ， 而 不 必 导 航 许 多 不 同类 型 的 存储 数据 的 物理 结构 。 


DBMS9 使 得 在 业务 需求 发 生变 更 时 修改 应 用 程序 更 容易 。 另 外 ， 新 类 别 的 数据 添加 到 数据 库 ， 也 不 会 中 断 现 有 的 系统 。 
数据 独立 性 
DBMS 在 数据 层 和 使 用 数据 的 应 用 程序 层 之 间 提 供 了 一 个 独立 层 。 换 句 话说 ， 应 用 程序 与 数据 的 结构 和 存储 之 间 是 绝缘 的 。 
DBMS 提 供 了 两 种 类 型 的 数据 独立 性 : 
- 逻辑 数据 独立 性 。 保 护 数 据 逻 辑 结构 不 受 变 更 。 
- 物理 数据 独立 性 。 保 护 数据 物理 结构 不 受 变更 。 
只 要 程序 使 用 了 DBMS 提 供 的 数据 库 API (应 用 编程 接口 ) ， 开 发 人 员 就 可 以 避免 修改 程序 ， 因 为 数据 库 发 生 了 变更 。 
SQL 是 一 个 API 
关系 数据 库 的 主要 API 是 SQL。 一 般 情 况 下 ， 当 数据 库 结 构 变 更 时 (例如 ， 表 添加 了 新 列 ) ， 大 多 数 应 用 程序 的 SQL 语 句 不 
需要 进行 变更 。 
其 他 类 型 的 DBMS 
虽然 此 前 讨论 的 四 种 数据 模型 是 主要 的 DBMS 类 型 ， 还 有 其 他 类 型 的 DBMS， 它 们 在 商业 上 拥有 不 同 程度 的 接受 度 。 
面向 对 象 的 DBMS (有 时 也 称 为 列 存储 ) ， 其 内 容 按 列 存储 而 不 是 按 行 。 这 样 对 于 需要 大 量 数据 项 聚集 计算 的 数据 仓库 很 有 
好 处 。 当 然 ， 面 向 列 的 DBMS 不 基于 任何 形式 的 数据 模型 ， 可 以 认为 是 关系 DBMS 的 一 种 特殊 物理 实现 。Sybase IJQ 和 Greenplum 都 
是 列 存储 的 例子 。NoSQL 数 据 库 系统 是 另 一 种 正在 获得 市 场 认可 的 DBMS 类 型 ， 通 常 是 在 大 型 数据 应 用 程序 。 大 多 数 NoSQL 产 品 
都 实现 了 键 值 存储 ， 其 中 数据 与 键 关 联 在 一 起 。 数 据 是 不 严格 的 结构 ， 不 需要 符合 典型 数据 库 设 计 的 模式 。NoSQL 数 据 库 系统 


受到 面临 着 不 同 数 据 挑 战 的 企业 的 欢迎 ， 使 用 传统 RDBMS 解 决 方案 可 以 解决 这 些 挑战 。Cassandta 和 MongoDB 都 是 NoSQL 键 值 数 
据 库 系统 的 例子 。 


还 有 其 他 的 DBMS 实 现 ， 如 原 Adabas 的 倒 排 表 结 构 以 及 由 PC DBMS、dBaseIIL 和 dBaseIII 推 广 的 dBase 格 式 。 
数据 安全 


数据 的 安全 阻止 未 经 授权 的 用 户 查 看 或 更 新 数据 库 。DBMS 使 用 D 和 密码 控制 允许 用 户 访问 数据 库 中 的 哪些 部 分 。 例 如 ， 假 
设 一 个 员工 数据 库 ， 包 含 所 有 员工 的 个 人 数据 。 使 用 DBMS 安 全 机 制 ， 可 以 授权 薪资 支付 人 员 查 看 薪资 数据 ， 而 管理 者 可 能 只 人 允 
许 查 看 与 项 目 历 史 有 关 的 数据 。 


并 发 控制 


DBMS 可 以 为 多 个 并 发 执行 的 用 户 程序 提供 数据 。 这 需要 一 种 锁定 机 制 来 提供 并 发 控制 ， 因 为 同时 运行 的 不 同 程序 的 操作 可 
能 会 导致 数据 的 不 一 致 。 例 如 ， 多 个 银行 ATM 用 户 可 能 会 从 仅 有 150 元 的 支票 账户 中 各 自 提 取 到 100 元 。DBMS 确 保 这 类 问题 是 
可 以 避免 的 ， 因 为 锁定 机 制 可 以 隔离 完全 相同 的 数据 竞争 的 交易 。 


数据 库 日 志 


DBMS 使 用 数据 库 日 志 记录 数据 库 对 象 修改 “之 前 ”和 “之 后 ”的 映像 。 重 要 的 是 数据 库 日 志 可 以 捕获 每 一 次 数据 修改 的 信 
息 ( 除 DBA 确 定 的 情况 ) 。 数 据 库 日 志 中 的 信息 可 以 用 来 撤销 和 重 做 事务 。DBMS 对 数据 库 日 志 的 处 理 是 完全 透明 的 ， 即 自动 进 


s= 


{To 


确保 原子 性 和 耐久 性 


DBMS 可 以 用 来 保证 全 有 或 全 无 的 事务 的 质量 。 这 称 作 原子 性 ， 意 味 着 即使 系统 在 一 个 事务 中 崩 演 ， 也 要 保持 数据 的 完整 


DBMS 提 供 了 定义 规则 的 机 制 ， 管 理 那些 可 以 存储 在 特定 的 字段 或 列 的 数据 类 型 。 只 有 符合 业务 规则 的 数据 才 会 存储 在 数据 
库 中 。 此 外 ， 可 以 对 DBMS 进 行 设置 ， 来 管理 不 同类 型 数据 之 间 的 关联 ， 并 确保 相关 数据 元 素 的 变更 都 准确 实施 。 


数据 访问 


DBMS 提 供 的 标准 查询 语言 ， 使 用 户 能 够 以 交互 的 方式 查询 数据 库 ， 并 且 分 析 其 数据 。 对 于 关系 型 数据 库 ， 其 标准 的 APl 是 
SQL 或 结构 化 查询 语言 。 但 是 ，SQL 不 是 关系 DBMS 所 必需 的 。 此 外 ， 许 多 DBMS 产 品 附带 的 分 析 工 具 和 报告 生成 程序 又 进一步 
简化 了 数据 访问 。 


A.3 小 结 


这 部 分 在 DBMS 基 本 原理 中 简单 带 过 ， 因 为 这 本 书 的 重点 是 数据 库 管 理 ， 并 且 大 多 数 读者 会 发 现 这 种 内 容 并 不 陌生 。 如 果 你 
需要 了 解 DBMS 和 数据 库 基本 操作 及 特性 的 更 多 细节 ， 请 参考 Bibliography 部 分 DBMS 相 关 书 籍 的 列表 。 我 喜欢 的 书籍 有 : 


- CJ.Date #9 «An Introduction to Database Systems》 第 8 版 ， 学 术 和 理论 方法 的 材料 。 


- Fabian Pascal 的 两 本 书 : «Practical Issues in Database Management» fe «Understanding Relational Databases» ， 由 书 名 即 可 得 


知 主题 。 
- Joe Celko 的 《Data&Database: Concepts in Practice》， 很 好 且 实 际 地 概述 了 主题 。 


- Pratt 和 Adamski 的 《The Concepts of Database Management» 的 最 新 版 ， 或 Rob 和 Cotronel 的 《Database Systems: 


Design, Implementation, and Management» ， 它 们 都 对 DBMS 概 念 有 很 高 水 平 的 解读 。 


DBMS 的 主要 优点 是 其 能 够 在 维护 和 查询 大 量 数 据 的 同时 还 能 保证 数据 的 完整 性 和 一 致 性 。 它 提供 了 透明 的 故障 恢复 、 并 发 
访问 和 数据 的 独立 性 。 事 实 上 ， 最 现代 化 的 计算 机 应 用 程序 依赖 DBM S 和 数据 库 技 术 来 管理 数据 。 了 解 这 一 主题 对 所 有 的 上 T 专 业 
人 员 都 很 有 好 处 。 


附录 B ”DBMS 供 应 商 


有 很 多 DBMS 供 应 两 可 以 选择 。 然 而 ， 它 们 在 DBMS 市 场 上 根据 人 气 、 支 持 和 领导 地 位 也 有 明确 的 层级 。 在 一 般 情况 下 ， 市 
场 可 以 细 分 为 以 下 几 种 : 


. 三 大 巨头 : 三 大 市 场 领导 者 构成 了 DBMS 客 户 群 的 大 部 分 ， 以 及 任何 新 的 销售 量 的 大 部 分 。 

: 第 二 层级 : 拥有 稳定 产品 的 大 型 DBMS 供 应 商 ， 但 在 功能 和 用 户 群 方面 落后 于 三 大 巨头 。 

其 他 重要 的 供应 商 : 拥有 可 行 的 、 支 持 企 业 级 产品 的 其 他 DBMS 供 应 商 。 

“ 开源 : 支持 开源 软件 的 DBMS 产 品 〈 不 是 单一 的 供应 商 ) o 

SERA: 提供 预先 的 关系 型 DBMS 来 支持 传统 的 应 用 程序 的 供应 商 。 

: NoSQL: 用 于 大 型 数据 的 非 关 系 DBMS 产 品 ， 具 有 高 度 的 可 扩展 性 ， 可 以 支持 现代 Web 应 用 程序 。 
: 面向 对 象 (OO) : 连同 OO 语言 和 开发 项 目 一 起 使 用 的 ODBMS 产 品 供应 商 。 

- 基于 PC: 虽然 许多 其 他 的 供应 商 也 会 创建 PC 版 本 ， 但 是 这 些 公司 或 产品 只 专注 于 PC 平台 。 


下 面 针 对 每 个 市 场 群体 进行 更 为 详细 的 介绍 。 


B1 三 大 巨头 


Oracle 公 司 、IBM 公 司 和 Microsoft 公 司 是 DBMS 供 应 商 的 领导 者 ， 且 排名 分 先后 。Oracle 的 客户 群 比 任何 其 他 DBMS 都 要 
大 ， 并 且 Oracle 的 使 用 人 群 也 比 任何 其 他 DBMS 多 。IBM 的 DB2 排 在 第 二 位 并 且 正 在 迎头 赶 上 。 凭 借 IBM DB2 在 大 型 机 近乎 垄 
断 的 地 位 及 其 日 益 增 长 的 UNIX 和 Windows 客 户 群 ，IBM 可 以 声称 它 拥有 几乎 与 Oracle 一 样 多 的 用 户 。 整 体 排 在 第 三 位 、 但 在 
Windows 机 器 上 排 在 首位 的 是 Microsoft， 以 及 Microsoft SQL Server。Microsoft SQL Server 只 能 在 Windows 平 台 上 运行 。 


联系 方式 : 


Oracle Corporation 

500 Oracle Parkway 
Redwood Shores, CA 94065 
www.oracle.com 

IBM Corporation 

New Orchard Road 
Armonk, NY 10504 
www.ibm.com 

Microsoft 

1 Microsoft Way 
Redmond, WA 98052-6399 


www.microsoft.com 


B2 第 二 层级 


第 二 层级 的 DBMS 供 应 商 类 别 中 包括 的 公司 在 20 世 纪 80 年 代 曾 经 是 市 场 的 领导 者 。Sybase 是 一 家 在 数据 库 技术 上 领先 的 创 
新 者 ， 其 引入 的 概念 有 客户 机 /服务 器 模式 、 存 储 过 程 ， 以 及 更 多 。 事 实 上 ，Microsoft SQL Server 是 基于 Sybase 技术 的 。 
Sybase 在 2010 年 由 德国 的 打包 应 用 程序 供应 商 SAP 收 购 。 


Teradata 是 另 一 个 数据 库 技术 的 创新 者 ， 其 业务 模型 主要 是 数据 仓库 和 分 析 。Teradata 成 立 于 1979 年 ， 前 身 是 NCR 公 司 的 
一 个 部 门 ， 但 它 在 2007 年 10 月 从 NCR 分 拆 成 为 一 个 独立 的 实体 。 


Informix 是 另 一 个 因 发 展 战略 走 入 歧途 而 衰落 的 领导 者 。 所 有 Informix 的 DBM 资产 被 |BM 公 司 在 2001 年 夏天 收 


购 ，Informix 继 续 受 1BM 的 支持 并 且 由 许多 重视 性 能 的 企业 使 用 。 


联系 方式 : 

Sybase Inc. (an SAP Company) 
6475 Christie Avenue 
Emeryville, CA 94608 
www.sybase.com 

Teradata Corporation 

10000 Innovation Drive 


Dayton, OH 45342 


www.teradata.com 


B.3 ”其 他 重要 的 供应 商 


除了 先前 列 出 的 供应 商 ， 一 些 额 外 的 供应 商 提 供 的 关系 产品 也 具有 较 高 级 的 功能 和 合理 数量 的 客户 群 。 其 中 最 重要 的 是 
Ingres， 目 前 由 Actian Corporation 销 售 。Ingres 的 第 一 次 关系 型 DBM 实现 是 在 加 州 大 学 的 伯克利 分 校 。Ingres 代 码 由 
Relational Technologies 增 强 为 一 种 商业 产品 。 后 来 Relational Technologies 变 成 了 Ingres 公 司 ， 其 曾经 被 ASK 公 司 购 买 ， 然 
后 又 被 Computer Associates (CA 技术 ) 购买 。Computer Associates 最 终 从 Ingres 分 拆 出 去 成 为 一 家 独立 的 公司 ， 开 源 了 
Ingres。 该 公司 在 2011 年 更 名 为 Actian。lngres 仍 然 拥有 大 量 的 用 户 ， 特 别 是 在 欧洲 。 


另 一 个 重要 的 供应 商 是 Software AG 的 Adabas 和 Tamino DBMS 产 品 。Adabas 的 根源 是 一 个 倒 排 表 DBMS， 后 来 增强 成 为 
关系 型 DBMS。Tamino 是 Software AG 的 新 的 基于 XML 的 DBMS。 


联系 方式 : 

Actian Corporation 

500 Arguello Street, Suite 200 
Redwood City, CA 94063 
www.actian.com 

Software AG 

Uhlandstr.12 

64297 Darmstadt 

Germany 


www.softwareag.com 


B.4 开源 DBMS 供 应 商 


人 们 对 Linux 的 迅速 接受 以 及 媒体 的 关注 使 开源 社区 变 得 活跃 。 术 语 开源 是 指 用 户 可 以 自由 运行 、 复 制 、 分 发 、 学 习 、 改 变 
和 改进 的 软件 。“ 开 源 ”往往 解释 为 免费 软件 ， 这 是 可 以 理解 的 ， 但 免费 开放 源码 的 概念 更 接近 “自由 ”， 而 不 是 “没有 限 
制 ”。 开 源 软件 坚持 以 下 的 信念 : 


* 用 户 可 以 自由 运行 程序 ， 出 于 任何 目的 都 行 。 

* 用 户 可 以 自由 检查 程序 的 实际 源 代码 来 确定 它 是 如 何 运行 的 。 
* 用 户 可 以 根据 他 们 的 特定 需求 ， 自 由 修改 和 调整 软件 。 

* 用 户 可 以 自由 将 副本 分 发 给 任何 人 。 


用 户 可 以 自由 将 他 们 的 代码 修改 向 公众 发 布 ， 以 便 使 整个 社区 受益 。 


有 两 个 领先 的 开源 DBMS 产 品 : PostgreSQL 和 MySQL。 除 了 变 成 一 种 商业 产品 之 外 ，lngres 在 伯克利 得 到 了 增强 ， 最 终 变 
成 了 名 为 Postgres 的 第 二 代 DBMS， 然 后 就 有 了 名 为 PostgreSQL 的 SQL 版 本 。 有 几 个 PostgreSQL 的 分 销 商 ， 也 可 以 从 
www.postgresql.org/ 免 费 下 载 。 


MySQL 是 一 种 真正 意义 上 的 多 用 户 、 多 线程 的 SQL 数据 库 服务 器 。 它 可 以 从 www.mysql.com 免 费 下 载 ， 但 在 技术 上 ， 它 并 
不 是 开源 PDBMS。 因 为 你 无 法 访问 到 源 代码 ， 无 法 对 它 进行 修改 。 此 外 ， 如 果 你 出 售 MySQL， 或 者 收取 管理 服务 器 的 费用 ， 又 
或 者 将 MySQL 作 为 其 他 产品 的 一 部 分 ， 你 都 必须 购买 许可 证 。 


Oracle 公 司 在 2009 年 收购 了 MySQL， 但 对 MySQL 的 继续 支持 和 宣传 与 收购 之 前 没什么 两 样 。 


B.5 非 关 系 型 的 DBMS 供 应 商 


20 世 纪 80 年 代 初 ， 在 关系 技术 被 商业 接受 之 前 ，DBMS 市 场 主要 基于 大 型 机 并 且 受 控 于 两 大 供应 商 : IBM 和 Cullinet。IBM 
的 IMS 是 一 个 分 层 DBMS， 将 数据 组 织 成 树 形 结构 。Cullinet 销 售 IDMS，CODASYL DBMS 将 数据 组 织 成 网 络 结构 。 在 20 世 纪 
80 年 代 中 后 期 ，Cullinet 被 Computer Associates 收 购 。 


B.6 NoSQL DBMS 供 应 商 


另外 ， 非 关系 型 DBMS 的 最 新 形式 是 NoSQL 数 据 库 系 统 。 在 较 高 层面 上 ，NoSQL 意 味 着 非 关 系 型 的 、 分 布 式 的 、 灵 活 的 和 
可 扩展 的 。 亦 有 不 少 是 开源 的 。NoSQL 产 生 于 对 “现代 ”数据 库 系 统 支持 Web 举 措 的 感知 性 需求 。 此 外 ，NoSQL DBMS 一 些 
常见 的 属性 包括 缺乏 模式 、 使 用 简单 、 支 持 复制 ， 以 及 “最 终 一 致 ”的 能 力 (而 不 是 典型 的 ACID 事务 能 力 ) 。 这 真 的 并 不 意味 
着 没有 SQL 支持 。 事 实 上 ， 今 天 “no” 更 为 常见 的 定义 为 “不 仅 ”。 


有 大 量 可 用 的 NoSQL 数 据 库 系统 ， 但 较 受 欢迎 的 包括 : 


- CouchDB: 面向 文档 的 数据 库 ， 可 以 在 JavaSctipt 中 以 MapReduce 风 格 进行 查询 和 索引 。CouchDB 还 提供 双向 冲突 检测 和 解 


决 方法 的 增 量 复制 。 
-MongoDB: 可 扩展 、 高 性 能 、 开 源 、 面 向 文档 的 数据 库 系 统 。 


- Hadoop 和 HBase: Apache Hadoop 项 目 为 可 靠 、 可 扩展 、 分 布 式 的 计算 开发 的 开源 软件 。HBase 是 Hadoop 数 据 库 系统 。 它 支 
持 对 大 数据 的 随机 、 实 时 的 读 / 写 访问 。 


网 站 http://nosql-databse.org/ 提 供 了 市 场 上 可 以 买 到 的 NoSQL 数 据 库 系统 的 纲要 。 


B.7 面向 对 象 的 DBMS 供 应 商 


在 20 世 纪 80 年 代 末 和 90 年 代 初 的 某 个 时 间 点 ， 面 向 对 象 的 数据 库 管理 系统 (ODBMS) 被 大 家 迅速 地 接受 。 出 于 多 种 原因 
(难以 查询 、 没 有 坚实 的 数据 模型 等 ) ， 这 项 技术 并 没有 广泛 采用 。 事 实 上 ,许多 ODBMS 供 应 商都 将 各 自 的 产品 重新 定位 成 电 
子 商务 解决 方案 或 面向 对 象 的 应 用 程序 开发 人 员 的 数据 库 组 件 。 但 也 有 ODBM 用 户 的 利 基 口 袋 。 


以 下 供应 商 仍 在 提供 ODBM SS 产品 和 组 件 : 


- Process Software #7 Object Store (www.progress.com) o 


- Ontos (www.ontos.com) o 


- Poet (www.poet.com) o 


B.8 基于 PC 的 DBMS 供 应 商 
比 成 熟 的 企业 级 DBMS 产 品 简单 易 用 ， 基 于 PC 的 DBMS 产 品 为 基于 PC 的 数据 和 应 用 程序 提供 了 结构 化 的 存储 。 下 面 的 供应 
商 和 产品 是 基于 PC 的 DBMS 的 市 场 领导 者 : 
- dBase at www.dbase.com 
- FileMaker at www.filemaker.com 
- Lotus Approach at www.ibm.com/software/lotus/products/smart-suite/approach.html (included in Lotus SmartSuite) 
- Microsoft Access at www.microsoft.com/office/access/ 


- Paradox at www.corel.com (included in the Professional edition of WordPerfect Office) 


附录 C DBA 工具 供应 商 


在 第 23 章 讨论 了 各 种 各 样 的 工具 ， 它 们 可 用 来 缓解 数据 库 管 理 的 负担 。 许 多 世界 上 最 大 的 独立 软件 供应 商 (ISV) 都 提供 
DBA 工 具 。 本 附录 列 出 了 主要 的 参与 者 。 


C.1 主要 的 供应 商 


尽管 有 许多 1SV 生 产 和 销售 DBA 工 具 和 实用 程序 ， 下 面 的 四 家 供应 商 是 国内 领先 的 独立 DBA 工 具 供应 商 。 这 些 供应 能 够 中 脱 
颖 而 出 ， 因 为 他 们 提供 的 工具 支持 多 个 DBMS 并 且 工 具 的 类 别 不 止 一 个 。 在 为 拥有 多 个 DBMS 的 异 构 公司 评 估 DBA 工 具 时 ， 这 些 
都 是 你 首先 应 该 考虑 的 供应 商 : 


BMC Software 

2101 City West Blvd. 
Houston, TX 77042 
www.bmc.com 

CA Technologies, Inc. 
One CA Plaza 


Islandia, NY 11749 


www.ca.com 

Embarcadero Technologies 

100 California Street, 12th Floor 
San Francisco, CA 94111 
www.embarcadero.com/ 


当然 ， 所 有 的 DBMS 供 应 商 本 身 也 为 各 自 的 DBMS 产 品 出 售 附加 DBA 工 具 。 主 要 DBMS 供 应 商 的 列表 及 其 联系 信息 请 参阅 附 
录 B。 


C.2 ”其 他 DBA 工 具 供 应 商 

除了 上 面 提 到 的 主要 DBA 工 具 供应 商 ， 下 面 的 每 一 家 供应 商都 出 售 附加 DBA 工 具 。 与 前 面 列 出 的 供应 商 相反 ， 这 些 供应 商 
可 能 专注 于 某 些 特殊 领域 。 例 如 ， 一 些 可 能 只 出 售 性 能 管理 工具 ， 而 另 一 些 提供 的 工具 可 能 只 适用 于 Microsoft SQL Server, 

这 些 供应 商 的 网 站 列 出 了 他 们 所 提供 的 工具 类 型 的 额外 信息 。 

- Allen Systems Group: www.asg.com/ 

- Application Security: www.appsecinc.com/ 

- Aquafold: www.aquafold.com/ 

- Bradmark Technologies: www.bradmark.com/ 

- Bunker Hill Corporation: www.bunkerhill.com/ 

- Candle Corporation: www.candle.com 

- CDB Software: www.cdbsoftware.com 

- Cogito: www.cogito.co.uk/ 

- Compuware Corporation: www.compuwate.com 

- Confio Software: www.confio.com/ 

- DataBee: www.databee.com/ 

- DBE Software: www.dbesoftware.com/ 

- DBI Software: www.dbisoftware.com/index.php 

- dbMaestro: www.dbmaestto.com/ 

* Hit Software: www.hit.com 


- Idera: www.idera.com/Content/Home.aspx 


- InfoTel Corporation: www.infotelcorp.com 

- NetIQ: www.netig.com 

* Quest Software: www.quest.com (purchased by Dell in 2012) 
- Red Gate Software: www.red-gate.com 

* Relational Architects: www.telarc.com 

- Responsive Systems: www.tesponsivesystems.com 

- Rocket Software: www.tocketsoft.com 

- SEGUS Inc.: www.segus.com 

- Softbase Systems Inc.: www.softbase.com 

* SoftwareOnZ LLC: www.softwareonz.com 


* White Sands Technology, Inc.: www.whitesands.com 


这 些 不 只 是 出 售 附 加 DBA 工 具 的 供应 商 ， 他 们 还 是 一 些 更 大 、 更 成 功 的 ISV。 额 外 的 工具 类 别 和 相关 的 ISV 都 列 在 以 下 的 章 


PA, 


C.3 ”数据 建 模 工具 供应 商 


Computer Associates International 
www.ca.com 

Product: ERwin 

Datanamic 
www.datanamic.com 

Product: DeZign for Databases 
Embarcadero Technologies 
www.embarcadero.com 
Product: ER/Studio 

Grandite 

www-.silverrun.com 

Product: SILVERRUN 


IBM Corporation 


www.ibm.com 

Product (s) : Rational System Architect, InfoSphere Data Architect 
Microsoft Corporation 

www.microsoft.com 

Product: Visio Enterprise 

ModelRight 

www.modelright.com 

Product: ModelRight 

Oracle Corporation 

www.oracle.com 

Product: Oracle Designer 

Powersoft (Open Tools Division of Sybase) 
www.sybase.com/products/modelingdevelopment/powerdesigner 
Product: Power Designer 

Visible Systems 

www.visible.com/ 


Product: Visible Analyst, Visible Advantage 


C4 存储 库 供应 商 


Adaptive Ltd. 

www.adaptive.com/ 

Product: Adaptive Information Manager 

Allen Systems Group 

www.asg.com 

Product: ASG-Rochade, ASG-Manager, ASG-Vista 
CA Technologies, Inc. 


www.ca.com 


Product: CA Repository 
IBM Corporation 
www.ibm.com 


Product: ClearCase 


C.5 ”数据 移动 和 商业 智能 供应 商 


下 面 的 公司 提供 数据 移动 和 ETL 工 具 : 

- CoSort/IRI: www.cosort.com/ 

- Informatica: www.informatica.com 

- Information Builders: www.informationbuildets.com 
< Serena: www.serena.com/ 

- SQData: www.sqdata.com 

- Treehouse Software: www.trechouse.com 

- Vision Solutions: www.visionsolutions.com/ 

下 面 的 公司 提供 商业 智能 和 OLAP 工 具 : 

- Actuate: www.actuate.com 

- Cardett Associates: www.cardett.co.nz/ 

- Computer Associates: www.ca.com 

- IBM Corporation (Cognos) : www.ibm.com 

- Oracle Corporation (Hyperion) : www.oracle.com 
- SAP (Business Objects) : www.sap.com, www.sap.de 
- SAS Institute: www.sas.com 


- Visual Insights: www.visualinsights.com/ 


再 次 ， 所 有 主要 的 DBMS 供 应 商都 为 各 自 的 DBMSs 产 品 提供 附加 ETL 和 商业 智能 工具 (也 经 常 为 异 构 ETL 和 BI 提供 ) 。 


附录 D DBA 的 网 络 资源 


DBA 在 互联 网 连接 的 世界 并 不 孤单 。 在 他 们 所 掌握 的 网 络 上 有 许多 在 线 资源 。 凭 借 互 联网 ，DBA 可 以 获得 丰富 的 知识 ， 并 
从 他 们 同行 那里 学 习 到 很 多 经 验 。 然 而 ， 要 充分 利用 这 些 在 线 的 资源 ，DBA 必 须要 知道 存在 哪些 资源 ， 如 何 访问 以 及 在 哪里 可 
以 找到 它们 。 本 附录 将 讨论 一 些 DBA 可 用 的 互联 网 资源 。 那 些 不 利用 自己 所 掌握 的 互联 网 资源 的 DBA 实 在 是 对 不 起 自己 。 


D.1 ” Usenet 新 闻 组 


每 当 讨论 互联 网 的 时 候 ， 很 多 人 想到 的 只 是 万 维 网 。 然 而 ， 互 联网 有 很 多 种 。 一 种 经 常 被 大 家 忽视 的 资源 是 Usenet 新 闻 
是 专家 信息 的 沃土 。Usenet (User J 收集 了 大 量 的 小 组 讨论 ， 称 为 新 闻 组 。 每 个 新 闻 组 都 是 一 个 预先 确 


使 用 新 闻 阅 读 器 软件 ， 任 何 互 联网 用 户 都 可 以 访问 新 闻 组 。 新 闻 阅 读 器 软件 有 多 种 选择 ， 都 可 以 免费 下 载 和 使 用 。 可 以 从 


www.newsgroupreviews.com/ 查 看 可 用 的 选择 。 
有 许多 集中 讨论 数据 库 和 数据 库 相 关 问 题 的 新 闻 组 。 表 D-1 显 示 一 些 与 DBA 的 兴趣 最 相关 的 新 闻 组 。 
当然 ， 还 存在 许多 其 他 的 新 闻 组 。 你 可 以 使 用 新 闻 阅 读 器 软件 来 研究 你 可 以 参与 的 新 闻 组 ， 并 评估 他 们 讨论 的 质量 。 
表 D-1 DBA 感 兴趣 的 数据 库 相 关 的 Usenet 新 闻 组 


新 闻 组 名 称 描 述 


comp.client-server 
comp.compression.research 
comp.data.administration 
comp.databases 
comp.databases.ibm-db2 
comp.databases.informix 
comp.databases.ms-sqlserver 
comp.databases.object 
comp.databases.olap 
comp.databases.oracle.marketplace 
comp.databases.oracle.server 
comp.databases.oracle.tools 
comp.databases.oracle.misc 
comp.databases.sybase 
comp.databases.theory 


comp.unix.admin 


D.2 ”邮件 列表 


有 关 C/S 技术 的 信息 

有 关 数 据 压 缩 技术 的 研究 信息 

数据 建 模 和 数据 管理 问题 的 讨论 

数据 库 和 数据 管理 的 问题 

IBM DB2 系列 产品 的 信息 

Informix DBMS 的 信息 

Microsoft SQL Server DBMS 的 信息 

面向 对 象 的 数据 库 系统 的 信息 

数据 仓库 在 线 分 析 处 理 的 信息 

Oracle 市 场 信息 

Oracle RDBMS 的 信息 

Oracle 附加 工具 的 人 

Oracle 杂项 讨论 

Sybase Adaptive Server RDBMS 的 信息 
数据 库 技术 和 理论 的 讨论 

UNIX 管理 讨论 


èm uny 


1 
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另 一 种 有 用 的 DBA 互 联网 资源 是 邮件 列表 ， 邮 件 列表 是 一 种 社区 公告 板 ， 你 可 以 认为 它 相当 于 一 个 群发 邮件 的 邮件 列表 。 
但 是 ， 邮 件 列 表 不 是 垃圾 邮件 ， 因 为 用 户 收 到 任何 邮件 之 前 必须 特别 请 求 参与 。 这 就 是 所 谓 的 选择 加 入 。 


互联 网 上 有 许多 可 用 的 邮件 列表 ， 它 们 都 要 使 用 列表 服务 器 。 列 表 服 务 器 是 一 个 使 邮件 列表 订阅 请 求 和 信息 自动 进行 的 程 


序 。 两 种 最 常见 的 列表 服务 器 是 Listserv 和 Majordomo。Listserv 还 是 


见 的 邮件 列表 的 同义词 ， 但 它 实际 上 却 是 一 个 特殊 的 列 


表 服 务 器 程序 的 名 称 。 


只 需 订 阅 邮件 列表 ， 就 可 以 收 到 列表 服务 器 直接 发 送 到 你 的 收 件 箱 的 信息 。 收 到 的 信息 种 类 很 多 ， 从 新 闻 发 布 到 公告 ， 到 问 
题 再 到 答案 。 这 一 信息 与 新 闻 组 论坛 的 信息 非常 类 似 ， 除 了 它 是 通过 电子 邮件 直接 发 送 过 来 的 。 用 户 还 可 以 很 容易 地 回复 邮件 列 
表 信 息 ， 与 每 一 个 订阅 的 用 户 交 流 。 回 复 以 电子 邮件 的 形式 发 回 到 列表 服务 器 ， 然 后 列表 服务 器 转发 给 邮件 列表 中 所 有 其 他 的 成 


oo 
Ro 


要 订阅 邮件 列表 ， 只 需 向 合适 的 邮件 地 址 发 送 一 封 电子 邮件 请 求 订阅 即 可 。 好 几 个 网 站 (包括 下 面 的 ) 都 可 以 为 可 用 的 互联 
网 邮件 列表 编目 : 


- www.lsoft.com/lists/listref.html 


- www.listtool.com 


当然 ， 这 些 网 站 都 不 会 跟踪 你 的 每 一 个 邮件 列表 。 供 应 商 、 顾 问 、 门 户 网 站 和 用 户 组 也 提供 各 式 各 样 的 邮件 列表 。 确 保 你 知 
道 所 有 有 用 的 邮件 列表 的 唯一 方式 就 是 成 为 在 线 社区 的 积极 参与 者 。 表 D-2 提 供 了 一 些 数 据 库 相关 的 邮件 列表 的 详细 信息 ， 这 些 
邮件 列表 很 受 DBA 的 欢迎 。 


表 D-2 DBA 感 兴趣 的 数据 库 相 关 的 邮件 列表 


邮 件 描 述 
E-mail LISTSERV@LISTS.BLACKBOARD.COM bn an 
ORACLESIG A a Oracle DBA 特别 兴趣 组 
使 用 命令 SUBSCRIBE ORACLESIG 
eae E-mail LISTSERV@WWW.IDUG.ORG pian ymin wees 
2- TX DB2 系列 产品 的 讨论 
使 用 命令 SUBSCRIBE DB2-L 人 
E-mail lists@sswug.org : P ee ee 
SQL2K8 ; Microsoft SQL Server 及 其 相关 产品 的 讨论 


使 用 命令 SUBSCRIBE SQL2K8 


尽管 邮件 列表 已 经 不 像 之 前 那样 受 欢 迎 了 ， 但 有 些 仍然 是 非常 活跃 非常 重要 的 数据 库 信 息 资 源 。 


D.3 网站、 博客 和 门户 


当然 ，Web 也 是 数据 库 和 DBA 相 关 信 息 的 沃土 。 然 而 ， 在 Web 上 跟踪 东西 有 时 会 很 困难 ， 尤 其 是 如 果 你 不 知道 去 哪里 寻 
找 。 通 过 浏览 DBMS 供 应 商 、DBA 工 具 供 应 商 、 杂 志和 顾问 的 网 站 ， 可 以 发 现 一 些 不 错 的 DBMS 信 息 来 源 。 


D.3.1 供应 商 网 站 


最 好 的 DBA 资 源 之 一 是 你 所 使 用 的 DBM 软件 供应 商 的 网 站 。 在 这 样 的 网 站 上 ， 你 可 以 找到 有 关 发 布 时 间 表 和 缺陷 修复 的 最 
新 新 闻 、 信 息 、 可 下 载 的 手册 以 及 技术 支持 。 一 定 要 收藏 DBM S 供 应 商 的 网 站 并 定期 访问 ， 密 切 关 注 你 最 喜欢 的 数据 库 管理 系统 
的 动向 。 


主要 DBMS 供 应 商 的 网 站 是 : 
- IBM DB2 at www.ibm.com/softwate/data/db2/ 
- Informix at www.ibm.com/software/data/informix/ 


- Microsoft SQL Server at www.microsoft.com/sql/default.asp 


- Oracle at www.oracle.com/us/products / database /index.html 


- Sybase at www.sybase.com 


一 种 有 用 的 DBA 资 源 可 以 在 DBA 工 具 供应 商 的 网 站 上 找到 。DBA 工 具 供应 商 雇佣 了 许多 DBMSs 专 家 和 前 辈 DBA， 他 们 愿 
各 种 技巧 、 技 术 和 脚本 来 促进 他 们 的 公司 和 产品 。 附 录 C 列 出 了 几 个 最 受 欢迎 的 第 三 方 工具 供应 商 以 及 他 们 的 Web 地 址 和 
息 


D.3.2 ”杂志 网 站 
技术 杂志 每 周 都 会 发 布 不 同 种 类 的 数据 库 和 DBA 相 关 的 文章 。 一 些 杂 志 会 把 注意 力 集中 在 数据 库 和 DBA 相 天 的 问题 上 面 。 
更 好 的 是 ， 这 些 出 版 物 中 有 很 多 都 是 不 收费 的 ， 作 为 回报 你 需要 填写 一 份 公司 和 人 口 统 计 信息 的 订阅 请 求 。 


此 外 ， 许 多 平面 杂志 也 有 网 站 ， 在 线 提 供 许多 (如 果 不 是 所 有 的 ) 文章 。 这 些 内 容 中 有 一 些 只 提供 给 订阅 者 ， 但 许多 期 刊 提 
供 的 内 容 面向 所 有 的 浏览 者 。 一 些 优秀 的 杂志 网 站 包括 : 


- Oracle Magazine: www.oracle.com/oramag/index.html 

- IBM Data Management magazine: www.ibm.com/developerworks/data/dmmag/ 
- Database Trends and Applications: www.dbta.com 

- Information Management: www.information-management.com/ 

- SQL Server Pro magazine: www.Sqimag.com 


- Teradata Magazine: www.teradatamagazine.com/ 


D.3.3 ”顾问 网 站 


有 一 大 堆 专注 于 DBMS 技 术 的 顾问 。 然 而 ， 一 些 顾问 已 经 是 大 师 级 的 人 物 了 ， 因 为 他 们 愿意 在 各 种 会 议和 活动 以 及 通过 写 文 
章 来 分 享 他 们 的 知识 和 经 验 。 许 多 顶级 顾问 已 经 设置 了 内 容 丰富 的 网 站 ， 包 售 大 量 的 文档 、 演 示 文 稿 以 及 给 访问 该 网 站 的 任何 人 
的 提示 。 他 们 这 么 做 是 为 了 提升 他 们 的 业务 ， 同 时 获得 一 些 未 来 业务 的 线索 。 


一 些 领先 的 顾问 网 站 包含 有 趣 且 有 用 的 DBA 信 息 ， 它 们 是 : 

.Yevichn，Lawson&cAssociates， 主 要 关注 DB2: www.ylassoc.com. 

:TUSC， 主 要 关注 Oftacle: www.tusc.como 

- DBA Direct， 关 注 数据 库 管 理 : www.dbadirect.com. 

Fabian Pascal 的 网 站 ， 和 致力 于 推翻 关系 以 及 其 他 数据 库 技 术 的 错误 信仰 : www.dbdebunk.com。 
- The Pythian Group ， 关 注 DBA 和 各 种 顾问 服务 : www.pythian.com/。 


当然 ， 你 也 可 以 访问 本 书 作 者 的 网 站 www.craigsmullins.com 了 解 有 关 其 出 版 著作 的 详尽 在 线 目 录 以 及 更 多 其 他 信息 。 


D34 博客 


Web 上 数据 库 信 息 的 另 一 片 沃土 是 博客 。 博 客 是 一 种 特殊 类 型 的 网 站 (或 网 站 的 一 部 分 ) ， 经 常 更 新 但 形式 上 却 没有 典型 
的 技术 网 站 或 文章 正式 。 


术语 博客 是 短语 网 络 日 志 的 结合 。 博 客 通常 由 一 个 人 维护 ， 定 期 进行 条 目 注释 、 事 件 描述 以 及 其 他 事项 。 条 目 ( 称 作 博 客 帖 
F) 通常 以 颠倒 的 时 间 顺 序 排列 。 大 多 数 博 客 都 是 交互 式 的 ， 包 含 访 问 者 写 评论 的 地 方 。 对 于 某 些 博客 ， 评 论 区 域 可 能 比 内 容 区 
域 更 加 活跃 。 评 论 越 多 ， 日 志 通 常 就 更 有 趣 ， 也 更 有 教育 意义 。 


根据 Wikipedia (2011 年 2 月 ) ， 有 超过 156000000 博 客 存在 。 一 些 涵盖 了 数据 库 和 DBA 相 关 的 资料 ， 并 且 十 分 有 趣 、 有 教 
育 意义 的 日 志 有 : 


- DB2 Portal Blog: http://db2portal.blogspot.com 

- Getting the Most out of DB2 for z/OS: http://it.toolbox.com/blogs/db2zos 

- An Expert’ s Guide to DB2 Technology: http://it.toolbox.com/blogs/db21uw 
* Oracle Scratchpad: http://jonathanlewis.wordpress.com/2011/12/29/i-wish-4/ 
- An Expert’ s Guide to Oracle Technology: http://it.toolbox.com/blogs/oracle-guide 
- Richard Foote’ s Oracle Blog: http://richardfoote.wordpress.com/ 

- SQL Is Your Friend: http://it.toolbox.com/blogs/sqlisyourfriend 

< SQL Marklar: www.networkworld.com/community/mccown 

- SQL Rockstar: http://thomaslarock.com/ 

- Data and Technology Today: http://datatechnologytoday.wordpress.com/ 

- Obsessive-Compulsive Data Quality: www.ocdgblog.com/ 

- Data Governance: http://datagovernanceblog.com/ 


通过 日 志 聚 集 网 站 来 寻找 并 保持 特定 日 志 的 更 新 。 例 如 ， 寻 找 DB2 日 志 最 好 的 地 方 是 Planet DB2， 提 供 日 志 聚 集 服务 : 


www.planetdb2.com, 


最 后 ， 考 虑 标记 Pythian 的 日 志 缓 冲 ，Vanities 博 客 的 Carnival 在 www.pythian.com/news/。Carnival 博 客 可 以 认为 是 博客 
的 博客 。 特 别 地 ， 日 志 缓 冲 提供 一 种 非常 有 趣 的 方式 ， 密 切 关 注 数 据 库 管理 的 博客 上 都 在 说 些 什么 。 如 果 你 想 快 速 找到 一 大 堆 不 
同 的 数据 库 日 志 ， 它 可 以 帮 上 忙 。 根 据 Pythian Group， 日 志 缓冲 是 “DBA 和 其 他 对 数据 库 感 兴趣 的 人 聚集 在 一 起 ， 读 和 写 遍 布 
世界 的 同行 所 关注 的 问题 的 地 方 : 他 们 如 何 解 决 问题 、 使 用 技能 以 及 他 们 在 想 些 什么 ”。 


D.3.5 ”数据库 门 户 


有 许多 门户 网 站 提供 数据 库 和 DBA 相 关 信息 的 便利 收集 。 门 户 通 常会 提供 大 量 的 有 关 某 个 主题 的 信息 (以 及 相关 信息 的 链 
接 ) 、 搜 索引 警 、 定 制 选项 ， 以 及 有 相关 内 容 发 布 时 通过 电子 邮件 通知 用 户 的 能 力 。 下 面 的 网 站 可 以 作为 数据 库 专业 人 员 的 门 
P; 


The Database Site (www.thedatabasesite.com) 是 一 个 集 数 据 库 管 理 和 开发 问题 及 解决 方案 于 一 体 的 有 用 信息 源 。 它 
结合 了 门户 与 基于 网 站 的 杂志 ， 定 期 有 新 内 容 ， 提 供 重要 的 数据 库 相关 的 信息 和 网 站 的 链接 。 


TechTarget 出 版 了 SearchOracle (www.searchoracle.com) 和 SearchSQLServer (http://searchsql- 
server.techtarget.com) ， 以 及 它们 的 姐妹 网 站 
SearchDataManagement (http://searchdatamanagement.techtarget.com) 。 这 些 网 站 都 是 包含 了 有 用 信息 的 门户 ， 包 
括 各 种 技巧 、 文 章 、 讨 论 版 块 、“ 向 专家 提问 ”版 块 等 。 


The SQL Server Worldwide User Group (www.sswug.org/) 是 另 一 个 非常 有 用 的 DBA 门 户 网 站 。 其 名 称 似乎 表明 了 该 
门户 专注 于 SQL server， 是 SSWUG 主 要 的 主题 区 域 。 然 而 ， 该 门户 同时 也 涵盖 了 非常 广泛 的 数据 库 相关 的 主题 ， 包 括 DB2、 
Oracle、XML、 安 全 以 及 其 他 。 


The Data Administration Newsletter (www.tdan.com) 是 另 一 个 将 门户 和 杂志 相 结 合 的 网 站 ， 它 主要 关注 数据 管理 和 
数据 结构 方面 的 问题 。 


有 很 多 可 以 提供 DBA 有 用 信息 的 门户 。 一 些 专注 于 某 项 DBMS 技 术 ， 而 另 一 些 提供 异 构 信 息 。 


D.3.6 ”其 他 网 站 
许多 其 他 网 站 可 能 对 DBA 也 很 有 用 ， 或 DBA 很 感 兴趣 。 互 联网 最 好 的 地 方 之 一 是 能 够 提供 一 个 论坛 供 任何 人 共享 信息 之 
用 。 新 奇 有 趣 的 网 站 每 天 都 会 涌现 。 下 面 来 看 一 些 非常 适合 DBA 的 网 站 。 


提供 非常 有 用 的 DBA 服 务 的 是 DBAjobs.com (www.DBAjobs.com) 。 这 个 网 站 的 使 命 是 “增强 所 有 数据 库 专 业 人 员 的 职 
业 生 涯 并 为 委托 人 招聘 最 好 的 数据 库 天 才 ”。 找 数据 库 相 关 的 工作 一 定 要 上 这 个 网 站 ， 它 们 还 在 准备 简历 、 面 试 技 巧 、 薪 资 指导 
和 数据 库 新 闻 等 方面 提供 帮助 。 


收集 行业 标准 信息 的 网 站 也 很 有 用 。 例 如 ，ANSI (American National Standards Institute) , ISO (International 
Standards Organization) 、NIST (National Institute of Standards and Technology) 和 和 SEI (Software Engineering 
Institute) 都 提供 网 站 : 


- ANSI: www.ansi.org 

- ISO: www.iso.ch 

- NIST: www.nist.gov 

- SEI: www.sei.cmu.edu/ 


或 许 更 接近 DBA 所 需 技 术 信息 的 是 SQL 标准 网 站 : www.jcc.com/sql.htm。 这 一 网 站 旨 在 成 为 SQL 标 准 的 主要 信息 源 。 它 包 
含 了 记录 着 SQL 标 准 的 各 种 其 他 网 站 的 链接 。 


DAMA (Data Management Association) 联合 了 致力 于 高 级 数据 资源 管理 的 专业 人 员 。DAMA 网 站 
(www.dama.org) 记录 了 DAMA 发 起 的 各 种 会 议 ， 还 提供 数据 资源 管理 的 各 种 链接 、 资 源 、 时 事 通 信和 出 版 物 。 


每 个 主要 的 DBMS 供 应 商都 有 用 户 组 。 这 些 用 户 组 会 发 起 每 年 的 国际 会 议 ， 并 促进 数据 库 专 业 人 员 之 间 信 息 的 共享 。 这 些 用 
户 组 的 网 站 提供 有 关 会 议 位 置 和 日 期 的 有 用 信息 ， 以 及 各 种 文章 、 演 示 文 档 和 小 技巧 : 


- International DB2 User Group: www.idug.org 


- International Oracle Users Group: www.ioug.org/ 
* Professional Association for SQL Server: www.sqlpass.org 
- International Informix Users Group: www.iiug.org/ 
- International Sybase User Group: www.isug.com/ 
成 干 上 万 的 网 站 可 能 对 你 有 用 ， 如 果 你 将 DBA 作 为 你 的 职业 。 这 里 ， 我 收集 了 一 些 非常 不 错 的 : 
- Agile Modling: www.agilemodeling.com/ 
- Business Intelligence Network: www.b-eye-network.com/ 
- The Data Warehousing Information Center: www.dwinfocentet.org/ 
- The Data Warehousing Institute: www.tdwi.org/ 
- Object Management Group: www.omg.org 
- The OLAP Council: www.olapcouncil.org/ 
- The Open Group: www3.opengroup.org/ 
* Storage Networking Industry Association: www.snia.org 
- The Transaction Processing Council: www.tpc.org/ 
- The XML portal: www.xml.com 
- Web Farming site (data warehouse) : www.webfarming.com 


从 所 有 这 些 网 站 获得 DBMSs 版 本 、 管 理工 具 范例 等 最 新 信息 非常 有 用 ， 但 要 记 住 这 类 网 站 上 的 信息 大 多 带 有 个 人 偏见 。 要 寻 
找 不 带 个 人 偏见 的 信息 ， 你 应 该 访问 供应 商 的 门户 网 站 和 顾问 网 站 。 


附录 EDBA 公 开 招 聘 样本 


本 附录 提供 了 一 个 数据 库 管 理 员 的 公开 招聘 实例 。 它 可 以 用 作 企业 公开 招聘 DBA 的 模板 ， 也 可 以 由 对 企业 所 招聘 的 工作 类 
型 感 兴趣 的 DBA 用 来 应 聘 。 


公开 招聘 


数据 库 管 理 员 (DBA) 


协助 上 T 部 门 的 新 项 目 开发 数据 模型 (或 许 与 数据 架构 师 合 作 ， 或 许 独立 完成 ) 。 主 要 负责 企业 数据 库 和 数据 库 结构 的 定义 、 


创建 和 维护 。 分 析 、 测 试 并 实施 物理 数据 库 的 设计 来 支持 各 种 业务 应 用 程序 (包括 基础 定义 、 结 构 、 文 档 、 长 期 的 需求 、 操 作 指 
Fa) 。 确 保 数据 的 可 恢复 性 、 可 维护 性 、 完 整 性 和 对 物理 数据 库 的 空间 需求 能 够 通过 制定 和 监督 数据 库 管 理 相关 的 政策 、 程 序 以 
及 标准 得 到 满足 。 确 保 用 户 、 技 术 、 应 用 程序 和 公司 实体 之 间 的 高 度 协 调 ， 确 保 高 效 的 企业 数据 管理 。 最 重要 的 是 ， 确 保 解 决 方 
案 满足 业务 目标 ， 建 立 并 维护 用 户 对 IT 技能 的 高 度 信任 ， 关 心 用 户 的 业务 需要 。 愿 意 和 技术 水 平 参差 不 齐 的 客户 打交道 ， 愿 意 在 
高 压 、 复 杂 的 环境 中 工作 。 


工作 职责 


' 提供 一 流 的 应 用 程序 支持 : 解决 并 回答 RDBMS 和 平台 环境 (例如 ，UNIX、Windows、Linux、z/OS) 相关 的 所 有 问题 ; 必 
要 时 与 供应 商 的 技术 支持 联系 ; 促进 应 用 程序 开发 和 客户 端 问题 解决 能 够 快速 高 效 地 完成 。 
RDBMS 性 能 监测 与 调整 : 密切 监测 性 能 ; 识别 问题 并 实施 解决 方案 ; 确保 数据 库 快速 高 效 地 运行 


* 维护 数据 库 备份 /恢复 环境 : 确保 建立 数据 恢复 的 时 间 目 标 并 得 以 满足 ， 验 证 备份 策略 实现 的 正确 性 ; 制定 恢复 程序 ; 支 
持 恢复 由 用 户 或 系统 错误 导致 的 数据 损失 ;快速 响应 刷新 数据 。 


并 更 新 RDBMS 以 及 相关 产品 : 保持 RDBMS 是 当前 的 版 本 和 维护 级 别 ; 安装 支持 的 产品 ， 提 供 通 用 、 稳 定 的 生产 和 开 
发 环境 。 


+ 根据 需要 对 数据 库 结构 进行 重组 : 在 国定 的 时 间 间 隔 将 程序 实现 自动 化 ; 使 用 工具 对 数据 库 表 空间 、 表 和 索引 进行 重组 或 
碎片 整理 ; 提供 高 效 的 数据 库 环 境 ， 最 大 限度 地 提高 生产 力 和 性 能 。 


* 根据 要 求 对 应 用 程序 执行 刷新 : 根据 应 用 程序 开发 人 员 的 要 求 将 数据 从 一 个 环境 刷新 到 另 一 个 环境 ; 执行 必要 的 任务 来 做 
到 这 一 点 ， 包 括 : 导出 、 删 除 、 创 建 和 导入 ; 建立 并 安排 实现 刷新 的 脚本 ， 最 大 程度 地 减少 影响 ; 为 应 用 程序 开发 人 员 的 最 佳 开 
发 环境 提供 当前 数据 。 


* 根据 需要 引导 并 监督 数据 库 的 设计 过 程 : 搜索 并 推荐 最 佳 的 设计 标准 ; 发 布 标准 并 与 开发 人 员 一 起 合作 ; 规范 环境 ， 提 高 
工作 效率 。 


丛 查 并 实施 数据 库 结构 的 所 有 变更 ， 同 时 根据 服务 水 平 协议 还 要 确保 数据 的 完整 性 并 维护 数据 的 可 用 性 。 


- 容量 规划 与 报告 : 监测 文件 系统 的 空间 、 数 据 库 分 配 等 ; 验证 磁盘 存储 的 有 效 使 用 ; 回收 未 使 用 的 空间 ; 优化 空间 分 配 ， 
避免 空间 不 足 的 情况 发 生 。 


创建 、 开 发 并 审查 从 逻辑 模型 中 创建 的 物理 模型 ， 确 保 数 据 结构 和 数据 库 的 详细 物理 设计 符合 数据 建 模 、 数 据 库 设计 和 维 
护 各 方面 推荐 的 标准 、 指 南 和 程序 ; 确保 数据 建 模 和 设计 范例 应 用 正确 。 


:为 创建 和 维护 实体 数据 企业 模型 提供 合适 的 工具 、 程 序 和 实用 程序 。 

.能够 提供 实体 -关系 图 、 数 据 流程 图 、 数 据 库 标 准 化 模式 、 还 辑 到 物理 数据 库 的 映射 、DDL 和 各 种 数据 库 命令 。 

* 管理 企业 数据 词典 的 实现 和 使 用 。 

* 领导 数据 库 设计 、 应 用 程序 代码 的 设计 审查 ， 领 导 实 施 前 和 实施 后 的 能 力 会 议 ; 评估 新 数据 库 的 规模 。 

* 与 系统 程序 员 和 系统 管理 员 密 切合 作 ， 确 保 数据 库 系统 的 操作 与 系统 的 使 用 情况 一 致 ; 协助 并 指导 系统 参数 的 设置 。 


` 为 进入 和 管理 共享 数据 资源 制定 规则 、 程 序 和 标准 。 


技能 与 知识 要 求 
- 透彻 理解 关系 数据 库 模 型 ， 关 系数 据 库 技术 的 理论 知识 扎实 ， 顾 全 大 局 ， 能 够 构思 并 记录 创造 性 的 解决 方案 。 
. 具有 设计 、 建 模 、 开 发 和 支持 大 型 RDBMS 系 统 的 经 验 。 


" 具有 丰富 的 还 辑 和 物理 数据 库 设计 的 经 验 ， 数 据 建 模 技术 和 开发 方法 学 实战 经 验 ; 表 空 间 、 回 滚 段 和 数据 文件 的 物理 模式 


设计 经 验 。 
: 具有 数据 提取 、 数 据 迁 移 和 使 用 数据 排队 工具 的 经 验 。 
* 精通 数据 库 规范 化 技术 的 概念 和 实践 。 


+ 有 较 强 的 顶级 数据 库 概念 /设计 /开发 、 恢 复 技 术 、 性 能 监测 和 调整 、 结 构 化 查询 语言 、 关 系数 据 库 设计 技术 、JCL 的 工作 


经 验 。 


:了解 服 务 器 端 开发 的 问题 如 触发 器 、 存 储 过 程 和 数据 包 。 


. 较 强 的 以 客户 为 中 心 和 管理 客户 期 望 的 能 力 ; 能 够 建立 并 维护 较 高 水 平 的 用 户 信 任 以 及 对 IT 知识 水 平 的 信心 ， 关 心 用 户 的 


* 优秀 的 口头 和 书面 沟通 技巧 。 


* 能 够 向 不 同类 型 的 观众 (管理 人 员 、 用 户 、 供 应 商 、 技 术 人 员 ) 示范 和 讲解 各 种 技术 信息 ， 建 立 融洽 的 关系 ， 说 服 其 他 人 
并 获得 他 们 的 理解 。 


- 能 够 书写 明确 的 建议 和 技术 文档 。 

: 较 强 的 人 际 交往 能 力 ， 激 励 员 工 /团队 应 用 技能 和 技术 来 解决 动态 问题 的 能 力 ， 优 秀 的 团队 合作 能 力 。 

- 扎实 的 项 目 管理 技能 ， 有 效 地 管理 跨 多 个 职能 部 门 的 大 小 不 一 的 项 目 。 

.能够 针对 原来 的 业务 需求 权衡 各 种 建议 的 技术 解决 方案 ， 并 从 中 选择 出 最 具 成 本 效益 的 解决 方案 。 
-能够 与 久负盛名 的 资深 员工 合作 ， 提 供 指导 ， 分 配 任务 并 跟 进 任务 的 完成 情况 。 

- 熟练 掌握 一 些 特定 的 RDBMS 的 中 间 件 工具 和 实用 程序 ， 支 持 监测 、 数 据 库 迁移 、DDL 管 理 和 复制 等 活动 。 
具有 在 TCP/IP 环 境 跨 平 台 网 络 的 工作 经 验 。 

"SQL 广泛 的 知识 ， 包 括 编 程 和 优化 代码 的 方法 。 

“ 扎实 的 编程 知识 ，3GL/4GL/OO4GL 语 言 至 少 一 种 (如 C/C++、Perl、UNIX shell, Visual Basic) o 


了解 基于 网 络 的 GUI 者 最 佳 ( 例 如 ，Oracle JDevelopetr 和 WebSphere Studio) o 


工作 经 验 


计算 机 科学 、 工 程 或 相关 学 科学 士 学 位 ， 硕 士 学 位 优先 考虑 ， 接 受 有 同等 学 历 者 。 


: 3+ 年 设计 、 和 管理、 编程 和 在 一 个 或 多 个 计算 环境 中 (如 UNIX、z/OS、Windows、Linux、Web) 支持 RDBMS (如 Oracle、 


SQL Server, DB2) 的 深入 经 验 。 


* 处 理 基本 的 系统 管理 任务 的 能 力 ， 如 有 需要 还 可 以 履行 备份 的 角色 。 
具有 在 高 压 的 情况 下 和 复杂 的 环境 中 与 不 同 专业 技术 水 平 的 客户 合作 或 工作 的 经 验 。 


- 获得 开发 人 员 或 DBA 认 证 者 最 佳 ， 例 如 ，Ortracle DBA Certified Master (OCM) ~ Oracle DBA Certified 
Professional (OCP) 、Mictosoft Certified Database Administrator (MCDBA) 、Certiffed MySQL Professional (MySQL-Prof) 、IBM 


DB2 Universal Database Certified Solutions Expert (DB2) 4. 


工作 关系 
.与 IT 其 他 领域 的 系统 团队 和 同行 有 密切 的 合作 关系 。 
. 与 高 级 系统 编程 人 员 、RDBMS 和 系统 管理 员 密 切合 作 。 
:与 应 用 程序 用 户 联系 来 解决 问题 。 


. 与 应 用 程序 开发 人 员 频 繁 互动 ， 作 为 调解 人 和 客户 问题 的 解决 者 ; 在 性 能 问题 、 硬 件 /软件 升级 、 应 用 程序 设计 、 新 应 用 
程序 的 安装 和 实施 、 应 用 程序 工作 负载 的 增长 预测 和 衡量 等 活动 上 协同 工作 。 


* 主要 参与 高 层次 的 技术 战略 会 议 、 重 要 的 升级 决策 、 数 据 集合 的 容量 规划 、 性 能 报告 、 新 的 应 用 程序 设计 等 。 


.与 外 部 企业 的 同行 有 密切 的 工作 关系 。 
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失败 。 无 论 软件 和 硬件 是 否 失败 (ACID 中 的 A) ， 数 据 库 管理 系统 (DBMS) 必须 维护 原子 性 。 


属性 ”描述 实体 所 固有 的 事实 、 属 性 或 特性 。 每 个 属性 做 其 中 一 件 事情 : 描述 、 识 别 或 认同 。 

审计 “正式 验证 需求 、 法 规 、 标 准 和 /或 指导 的 有 效 性 、 准 确 性 和 一 致 性 。 

审计 跟踪 ”出 于 恢复 或 审计 的 目的 ， 维 护 数据 来 跟踪 某 些 活动 (如 事务 日 志 ) 。 

认证 确定 一 个 用 户 或 计算 机 身份 的 过 程 。 

授权 ”授予 权限 ， 人 允许 一 个 人 、 组 或 软件 代理 访问 某 种 资源 。 

自动 总 结 表 一 种 数据 库 对 象 ， 为 后 续 的 分 析 和 查询 提供 自动 聚集 和 存储 。 也 称 作物 化 查询 表 或 物化 视图 。 


可 用 性 ”系统 或 数据 资源 可 以 访问 的 时 间 与 期 望 的 访问 时 间 相 比 ， 其 所 占 的 百分比 。 


恢复 (1) 为 数据 库 中 的 数据 制作 副本 ， 在 发 生硬 件 或 软件 故障 需要 恢复 数据 库 中 的 数据 的 情况 下 ， 可 以 确保 数据 的 持续 
可 用 性 ; (2) 副本 本 身 。 


批 处 理 一 种 处 理 类 型 ， 将 计算 机 程序 编码 到 提交 的 工作 中 ， 使 它 的 执行 和 运行 不 需要 在 线 交 互 或 手动 干预 。 

基准 ”测量 、 对 比 和 评估 的 参考 点 ， 对 于 数据 库 系统 ， 基 准 通常 是 一 个 时 间 点 快照 测量 ， 用 于 与 其 他 基准 进行 对 比 。 
最 佳 实践 ”通常 认为 比 其 他 方法 更 能 有 效 地 提供 特别 结果 的 技术 、 方 法 、 过 程 、 学 科 、 动 机 或 奖励 。 

位 图 ”一 种 使 用 0 和 1 字符 串 或 位 的 索引 技术 。 位 图 的 每 个 键 值 都 索引 一 串 单独 的 0 和 1。 

Boyce-Codd 范 式 (BCNF) ”如 果 每 个 决定 因素 都 是 一 个 候选 码 ， 这 种 关系 就 满足 Boyce-Codd 范 式 。 


b-tree “一 种 键 控 的 、 树 状 的 索引 结构 。 


缓冲 池 《一 个 预 留 出 来 可 以 在 从 数据 库 读 取 实际 数据 时 避免 /O 操 作 的 内 存 区 域 。 也 称 作 数据 高 速 缓存 。 


商业 智能 (Bl) ”基于 计算 机 的 技术 ， 用 于 识别 、 提 取 和 分 析 商 业 数据 。BI 技 术 常 见 的 功能 有 报告 、 在 线 分 析 处 理 
(OLAP) 、 分 析 、 数 据 和 流程 挖掘 、 复 杂事 件 处 理 、 业 务 性 能 管理 、 基 准 和 预测 分 析 。 


字 节 ”以 电子 方式 存储 的 单个 数据 字符 ， 一 个 字 节 有 16 个 二 进 制 位 。 


缓存 存储 一 些 有 用 的 东西 。 在 数据 库 系 统 中 ， 往 往 是 用 于 存储 数据 、 参 数 或 程序 设置 的 内 存 区 域 。 
调用 级 别 接口 (CL) ” 定义 了 程序 如 何 向 DBMS 发 送 SQL 查 询 以 及 返回 的 数据 如 何 由 应 用 程序 通过 一 致 的 方法 处 理 。 


候选 码 ”可 以 用 来 唯一 标识 一 个 实体 实例 的 一 个 属性 或 一 组 属性 。 每 个 实体 可 能 拥有 一 个 或 多 个 候选 码 。 其 中 会 选 一 个 候选 
码 为 表 的 主 码 。 


基数 ”一 个 实体 对 之 间 可 以 存在 的 实例 的 个 数 。 另 一 种 方式 是 将 基数 看 作 适 用 于 某 个 特定 关联 的 实体 实例 的 个 数 。 有 时 ， 会 
用 术语 “ 度 ” 来 蔡 代 基数 。 数 据 库 管理 领域 内 的 术语 基数 的 一 种 蔡 代 用 法 是 ， 定 义 在 一 列 (或 一 组 列 ) 中 某 个 值 的 实例 个 数 的 天 
系 优化 程序 所 使 用 的 数据 库 统 计 信息 。 


EFIR ”第 卡 儿 连接 的 结果 ， 当 一 个 表 的 每 一 行 都 与 男 一 个 表 (或 它 自己 ) 的 每 一 行 连接 起 来 且 没 有 使 用 连接 谓词 时 ， 就 
是 笛 卡 儿 连 接 。 


SPINE ”使 用 综合 在 一 台 计 算 机 中 (或 耦合 的 计算 机 集群 ) 且 通 过 哑 终 端 访 问 的 计算 机 资产 。 

认证 某 个 组 织 向 满足 某 种 既定 标准 的 个 人 人、 组织、 过 程 、 服 务 或 产品 给 予 认可 的 过 程 。 

变更 数据 捕获 ”捕获 生产 数据 源 变 更 的 过 程 ， 通 常 使 用 于 数据 仓库 环境 。 

密码 ”一 种 用 于 执行 加 密 或 解密 的 算法 。 

cL， 见 “调用 级 别 接口 ”。 

客户 端 /服务 器 计算 ”一 个 多 层 的 计算 方法 ， 应 用 程序 可 以 通过 网 络 连接 访问 企业 的 共享 资源 。 

云 计算 “计算 作为 一 种 服务 交付 。 云 计算 应 用 程序 依赖 网 络 (通常 是 互联 网 ) 为 用 户 提 供 各 种 共享 资源 、 软 件 和 数据 。 


集群 (1) 数据 在 物理 上 被 某 个 指定 的 码 (一 般 通 过 索引 的 方式 实施 ) 拍 成 连续 的 顺序 的 条 件 。 (2) 使 用 多 个 独立 的 计 
算 系 统一 起 工作 ， 在 用 户 看 来 就 是 一 个 高 度 可 用 的 系统 。 


COBIT (信息 和 相关 技术 的 控制 目标 ) ”由 信息 技术 管理 学 会 发 布 的 IT 管理 标准 ， 见 www.aisca.org/cobit。 


CODASYL (数据 系统 语言 会 议 ) ”成 立 于 1959 年 的 一 个 联合 体 ， 引 导 可 用 于 多 台 计 算 机 的 标准 编程 语言 的 发 展 。 该 努力 导 
致 了 用 于 DBMS 的 网 络 数据 模型 、COBOL 以 及 其 他 标准 的 发 展 。 


列 一 种 数据 属性 ， 作 为 表 的 垂直 组 件 实施 在 关系 数据 库 中 ， 类 似 于 平面 文件 记录 的 一 个 字段 。 
COM (常见 对 象 模型 ) ”Microsoft 的 编程 规范 ， 用 于 对 象 的 互 操 作 性 ， 通 过 一 组 预定 义 的 、 称 为 接口 的 例 程 。 


提交 ”结束 一 个 工作 单元 的 SQL 语 句 。 


遵从 遵守、 完成、 执行 或 采取 行动 来 满足 另 一 方 的 某 些 规则 、 要 求 或 愿望 的 过 程 。 常 用 于 讨论 对 外 部 管理 或 行业 规则 的 顺 


Bate ”具有 多 个 属性 的 键 。 

概念 数据 模型 ”一 种 高 级 别 的 数据 模型 ， 可 以 识别 主要 的 实体 和 关联 ， 没 有 完全 属性 化 ， 因 此 不 需要 标准 化 。 

并 发 性 ”多 个 用 户 在 同一 时 间 必 须 访 问 同一 组 特定 的 数据 。 并 发 性 也 用 于 描述 数据 库 管理 系统 处 理 同步 查询 一 组 表 的 能 力 。 
config.ora 一 个 与 Oracle 客 户 端 有 关 的 文件 ， 为 Oracle 客 户 端 指定 了 某 些 默 认 值 、 文 件 和 目录 名 称 。 


一 致 性 ”数据 值 跨 元 余数 据 库 的 等 价 程度 。 对 于 事务 ， 一 致 性 指 的 是 : 在 事务 执行 前 后 ， 数 据 的 状态 。 一 个 事务 维护 了 数据 


状态 的 一 致 性 。 换 名 话说， 一 个 事务 运行 之 后 ， 数 据 库 中 所 有 的 数据 都 是 “正确 的 ” (ACID 中 的 C) 。 


约束 (1) 对 于 商业 活动 及 其 结果 数据 的 限制 ; (2) 用 于 强制 的 数据 库 机 制 。 
竞争 ”访问 共享 资源 如 内 存 、 磁 盘 人 存储、 数据 库 对 象 或 数据 页 面 时 出 现 的 冲突 。 
CORBA (通用 对 象 请 求 代理 架构 ) ”对 象 管理 组 的 独立 供应 商 架 构 和 基于 对 象 的 编程 互 操作 性 基础 设施 。 


光标 “一 个 移动 位 置 或 表明 一 个 位 置 的 指针 ， 用 在 程序 中 可 以 克服 SQL (一 次 一 设置 的 处 理 ) 与 应 用 程序 (一 次 一 记录 的 处 


理 ) 间 的 阻抗 不 匹配 。 
D 
数据 “表示 为 文本 、 数 字 、 图 形 、 图 像 、 声 音 或 视频 (没有 人 额外 定义 的 上 下 文 ) 的 事实 ; 用 于 创建 信息 的 原始 材料 。 
数据 库 ”一 个 有 组 织 的 数据 集 ， 通 常 以 数字 的 形式 显示 。 
数据 库 管理 员 ”负责 DBMS3 及 其 物理 数据 库 的 安装 、 配 置 、 管 理 、 监 测 和 维护 的 个 人 。 
数据 库 驱动 ”使 应 用 程序 能 够 通过 使 用 数据 库 协 议 包 从 数据 库 服 务 器 请 求 和 检索 网 络 中 的 数据 的 软件 。 
数据 库 网 关 ”人 允许 客户 端 通过 网 络 连 接 ， 访 问 存储 在 数据 库 服 务 器 中 的 数据 所 需 的 软件 。 
数据 库 管 理 系统 (DBMS) ”可 以 用 来 控制 数据 库 的 创建 、 维 护 和 使 用 的 软件 包 。 它 使 企业 可 以 方便 地 为 各 种 应 用 程序 开发 
数据 库 。 


数据 库 写 入 器 (DBWR) ”一 个 Oracle 进 程 ， 可 以 将 包含 在 内 存 数据 高 速 缓存 中 的 数据 写 入 物理 磁盘 文件 中 。 


数据 泄露 (data breach) ”安全 信息 泄露 到 一 个 不 可 信 的 环境 。 这 一 实例 的 其 他 术语 包括 : 无 意 信息 披露 、 数 据 泄 


Æ (data leak) 和 数据 泄露 (data spill) 。 


数据 高 速 缓存 ” 预 留 的 内 人 存 区 域 ， 用 于 避免 从 数据 库 读 取 实 际 数据 时 的 MO 操作 。 也 称 作 缓冲 池 。 

数据 清理 (data cleansing) ”检测 并 删除 和 /或 改正 数据 库 中 数据 的 行动 。 也 叫做 数据 清理 (data scrubbing) 。 
数据 控制 语言 (DCL) “用 于 控制 数据 和 数据 结构 访问 的 SQL 语句 ， 例 如 ，GRANT 和 REVOKE。 

数据 定义 语言 (DDL) ”用 于 创建 和 修改 数据 结构 的 SQL 语句 ， 例 如 ，CREATE、ALTER 和 DROP。 


数据 词典 ”附加 了 管理 数据 定义 的 数据 存储 的 软件 。 


数据 操作 语言 (DML) ”用 于 访问 和 修改 数据 的 SQL 语言 ， 例 如 ，INSERT、UPDATE、DELETE 和 SELECT。 

数据 管理 ”对 定义 的 一 组 数据 (包括 数据 消费 者 的 定义 ) 采取 行动 的 责任 和 义务 。 数 据 主管 没有 必要 是 数据 的 所 有 者 。 
数据 类 型 ”识别 出 各 种 类 型 的 数据 的 分 类 。 物 理 数据 库 设计 中 的 每 一 列 都 必须 分 配 一 个 数据 类 型 ， 如 整 型 、 字 符 等 。 
数据 仓库 ”用 于 报告 和 分 析 的 数据 库 。 

DBA 见 “ 数 据 库 管理 员 ”。 

DBCC ”用 于 一 致 性 和 完整 性 检查 的 Sybase 实用 程序 。 

DCL 见 “ 数 据 控制 语言 ”。 

DDL 见 “ 数 据 定义 语言 ”。 


死 锁 ” 并 发 进程 争 用 锁 时 发 生 的 一 种 特定 类 型 的 锁定 问题 。 例 如 ， 程 序 1 持 有 锁 A， 并 且 等 待 锁 B; 程序 2 持 有 锁 B， 并 且 等 


解密 ”加 密 的 反 过 程 ， 使 经 过 加 密 的 信息 变 得 可 读 (通常 需要 一 个 码 ) 。 

删除 ”用 于 从 关系 数据 库 删 除 行 的 SQL 语 句 。 

非 规范 化 ”撤销 规范 化 的 影响 ;将 一 个 事实 放 到 数据 库 的 许多 地 方 的 过 程 。 

设计 审查 “数据库 和 应 用 程序 代码 所 有 方面 的 效率 、 有 效 性 和 准确 性 都 得 以 审查 的 一 系列 会 议 。 
维 数 ”在 数据 仓库 中 ， 数 据 元 素 将 数据 集中 的 每 一 项 都 分 类 到 一 个 无 重 又 的 区 域 。 
脏 数据 ”不 正确 、 过 期 、 宛 余 、 不 完整 或 格式 不 正确 的 数据 。 

灾难 ”发 生 的 概率 很 小 、 高 度 不 确定 、 并 且 可 能 会 带 来 毁灭 性 后 果 的 事件 。 

灾难 恢复 ”将 一 个 数据 中 心 从 灾难 中 恢复 所 涉及 的 过 程 和 计划 。 

分 布 式 处 理 ”使 用 多 台 计 算 机 来 实现 一 个 服务 请 求 。 

DML 见 数据 操作 语言 ”。 

域 “定义 了 数据 元 素 有 效 值 的 范围 。 

DSNZPARM ”大 型 机 DB2 子 系统 的 系统 配置 参数 。 

DSNICOPY ”DB2 实 用 程序 ， 使 数据 库 文件 的 复制 不 受 DBMS 的 控制 。 


持久 性 ” 指 的 是 一 个 运行 中 的 事务 发 生 中 断 或 故障 所 产生 的 影响 。 如 果 事 务 异 常 结束 ， 持 久 性 事务 不 会 影响 数据 的 状态 。 数 
据 将 会 在 任何 故障 中 保存 下 来 。 


动态 SQL SQL 查 询 未 经 预 处 理 ， 并 且 其 访问 路 径 会 在 运行 前 的 运行 时 间 确 定 。 


封装 (1) 限制 对 象 的 某 些 组 件 的 语言 机 制 ; (2) 便于 数据 与 操作 方法 (或 其 他 函数 ) 进行 捆绑 的 语言 结构 。 

加 密使 用 算法 (密码 ) 转换 数据 的 过 程 ， 使 数据 变 得 对 任何 人 都 不 可 读 ， 除 了 那些 持 有 特殊 知识 (通常 称 为 码 ) 的 人 。 
企业 数据 模型 ”全 面 描述 整个 企业 数据 需求 的 单个 数据 模型 。 

实体 ”存在 且 能 够 进行 描述 的 事物 。 可 以 是 一 个 人 ， 一 个 地 方 ， 一 个 东西 ， 一 个 概念 或 有 关 你 的 企业 维护 某 些 事实 的 事件 。 
实体 完整 性 ”关系 数据 库 所 提供 的 数据 完整 性 的 最 基本 的 层面 指出 实体 的 每 个 实例 都 必须 是 唯一 可 识别 的 。 

实体 -关联 (E/R) E/R 图 生动 地 描述 了 数据 模型 的 所 有 实体 和 关联 。 

ETL 提取 /转换 /加 载 的 缩写 ,描述 了 用 于 生成 数据 仓库 的 工具 类 别 。 

HEN “修改 数据 来 阻止 其 他 进程 或 用 户 读 取 或 修改 相同 的 数据 时 ，DBMS 所 采用 的 锁 类 型 。 

解释 ”用 于 将 关系 优化 程序 选择 的 访问 路 径 实现 外 部 化 的 命令 (DB2、Oracle) 。 


表达 式 “” 执行 会 返回 值 的 某 些 事物 的 指令 。 


事实 表 ”维度 模型 的 中 央 表 ， 该 模型 包含 与 纬度 表 有 关 的 数值 度量 和 关键 事实 。 
回 退 在 软件 更 新 到 一 个 新 版 本 后 ， 表 返回 到 前 一 个 软件 版 本 的 过 程 。 


胖 客 户 端 ” 至 关 重 要 的 功能 驻 留 在 客户 端 计 算 机 的 客户 端 / 服 务 器 处 理 模型 。 


域 实施 在 屏幕 或 平面 文件 记录 中 的 属性 。 
第 5 范式 (5NF) ”指定 实体 的 每 一 个 连接 依赖 关系 都 必须 是 其 候选 码 的 后 果 。 
第 1 范式 (INF) ， 当 且 仅 当 所 有 底层 域 都 只 包含 原子 值 时 ， 该 实体 满足 第 1 范式 。 


FISMA ”联邦 信息 安全 管理 法 案 ， 也 称 作 电 子 政府 法 案 。 政 府 规章 说 明了 联邦 机 构 、 承 包 商 和 支持 它们 的 任何 实体 ， 必 须 
保持 与 潜在 风险 相称 的 安全 性 。 


修复 包 一 组 可 作为 修正 bug 和 安全 漏洞 的 整体 (不 是 个 体 ) 的 软件 补丁 。 

平面 文件 ” 纯 文本 文件 ， 其 中 文件 的 每 行 都 保留 一 条 记录 ， 字 段 通常 由 分 隔 符 (如 逗号 或 制 表 符 ) 进行 分 隔 。 
外 码 ”识别 实体 实例 之 间 的 关联 的 属性 或 一 组 属性 。 

第 4 范式 (4NF) ，” 当 且 仅 当 一 个 实体 满足 3NF， 并 且 没有 多 组 多 值 依赖 时 ， 该 实体 满足 第 4 范式 。 


函数 DBMS 支 持 的 一 个 预定 义 算法 ， 用 于 输入 数据 的 转换 、 操 纵 或 计算 。SQL 语 句 中 可 以 使 用 函数 的 任何 地 方 都 可 以 使 用 
表达 式 。 


GDG (世代 数据 组 ) ”使 用 在 大 型 机 系统 上 的 一 种 文件 结构 ， 其 中 一 组 组 的 数据 集 彼此 相关 (按时 间 和 功能 ) ， 并 且 共 享 
唯一 的 数据 集 名 称 。 每 个 GDG 数 据 集 都 分 配 了 年 代 和 版 本 号 。 


干 兆 字 节 (GB) “十 亿 字 节 的 存储 空间 ;1000 兆 字 节 (MB) 。 


GLB Gramm-Leach-Bliley 法 案 ， 也 称 作 《1999 人 金融 服务 现代 化 法 案 》。 美 国 颁布 了 一 项 联邦 法 案 来 控制 金融 机 构 处 理 个 
人 隐私 信息 的 方式 。 


治理 ” 某 个 责任 范围 的 统一 管理 、 统 一 政策 、 指 导 、 过 程 和 决策 权 。 例 如 ， 公 司 治理 可 以 涉及 隐私 政策 、 对 内 投资 和 数据 的 
使 用 。 


散 列 ”将 关键 值 通过 一 种 算法 转换 为 物理 存储 位 置 从 而 开局 数据 的 快速 直接 访问 的 技术 。 该 算法 通常 称 作 随 机 函数 发 生 器 ， 
因为 散 列 例 程 的 目标 是 能 够 通过 物理 存储 均匀 地 传播 关键 值 。 


HY “与 一 个 系统 的 均匀 性 或 缺乏 均匀 性 有 关 。 同 构 系统 的 组 成 或 特征 都 是 均匀 的 ;而 异 构 的 系统 则 至 少 在 某 种 特性 上 缺乏 
均匀 性 。 例 如 ， 同 时 使 用 Oracle 和 DB2 的 应 用 程序 可 以 认为 是 异 构 的 。 


Die ME (对 象 、 名 称 、 值 、 种 类 等 ) 的 一 种 排列 ， 其 中 所 有 的 项 目 都 表示 成 “上 面 ”、“ 下 面 ”或 “同一 层 ”。 按 照 数 
据 库 的 说 法 ， 如 果 数 据 库 的 数据 之 间 建 立 了 某 些 关联 ， 一 个 数据 项 表示 另 一 个 数据 项 的 从 属 ， 那 么 DBM 是 分 层 的 。 


HIPAA (健康 保险 流通 与 责任 法 案 ) ”政府 规章 规定 ， 医 疗 保健 提供 者 必须 保护 个 人 的 医疗 保健 信息 。 


HTML ( 超 文 本 标记 语言 ) ”网 页 的 主要 标记 语言 。 


IDE (集成 开发 环境 ) ”一 种 能 够 为 计算 机 程序 员 的 软件 开发 提供 全 面 设 施 的 软件 应 用 程序 。 


标识 属性 几 种 流行 的 关系 DBMS 支 持 的 功能 。 当 为 某 列 分 配 了 标识 属性 时 ，DBMS3 就 将 该 列 视 为 一 个 可 以 自动 生成 增 量 值 
的 存储 空间 。 用 户 在 向 表 中 插入 行 时 不 需要 提供 该 列 的 值 ，DBMS 会 自动 生成 。 


增 量 备份 ”只 包含 上 一 次 完整 备份 或 增 量 复制 以 后 变更 的 数据 的 数据 库 备份 。 
索引 一 种 可 以 用 来 快速 访问 数据 库 中 的 数据 的 物理 数据 库 对 象 。 


aa “具有 元 数据 形式 的 附加 上 下 文 的 数据 ， 包 括 定 义 、 数 据 之 间 的 关联 ， 以 及 其 他 可 能 的 信息 。 上 下 文 的 数据 与 元 数据 一 
起 构成 了 信息 。 


基础 设施 ”整个 企业 共同 使 用 的 设备 、 系 统 、 软 件 和 服务 ， 无 论 什 么 任务 、 程 序 、 项 目 。 
插入 “用 来 向 表 添 加 数据 的 SQL 语句 。 

实例 (1) 实体 的 一 个 实例 ; (2) 数据 库 服 务 器 的 实现 (如 Oracle 实 例 ) 。 

实例 化 ”为 了 创建 软件 对 象 或 数据 库 行 的 实例 。 


意向 锁 ” 用 户 或 进程 需要 锁定 某 些 数据 页 或 行 时 ， 放 置 在 较 高 层 数据 库 对 象 上 的 锁 的 类 型 。 意 向 锁 是 为 了 较 低 层 锁 的 使 用 寿 


隔离 ”事务 的 一 个 属性 ， 意 味 着 多 个 事务 可 以 同时 运行 。 任 何 并 行 运行 的 事务 都 认为 不 存在 并 发 。 换 名 话说， 好 像 系统 一 次 
只 运行 一 个 事务 。 要 实现 隔离 ， 需 要 一 种 锁定 机 制 (ACID 中 的 1) 。 


RARI ”指定 了 事务 或 语句 的 锁 的 行为 。 隔 离 级 别 越 高 ， 锁 协议 越 严 格 。 例 如 ,UNCOMMITTED READ, COMMITTED 
READ, REPEATABLE READ 和 SERIALIZABLE。 


Java 数 据 库 连接 (JDBC) ”调用 级 别 接口 (CLI) 人 允许 Java 程 序 与 数据 库 进行 交互 。 可 以 将 ODBC 想 象 成 java 程 序 。 
连接 “一 种 操作 ， 通 过 它 来 自 两 个 表 的 数据 合并 成 一 个 更 大 的 结果 表 ， 基 于 每 个 表 的 共享 数据 值 。 
JVM Java 虚拟 机 。 


J2EE (Java 2 平台 ,企业 版 ) ”一 组 经 过 协调 的 规范 和 做 法 ， 共 同 使 解决 方案 能 够 开 友 、 部 署 和 管理 多 层 企业 级 Java 应 用 程 


码 ”可 以 识别 实体 实例 并 定义 实体 间 的 关联 的 属性 。 
干 字 节 (KB) ”一 干 个 字 节 的 存储 空间 。 


知识 ”通过 经 验 或 组 织 熟 练 掌握 某 些 东西 的 事实 或 条 件 。 知 识 有 助 于 理解 并 保留 信息 。 


基于 标签 的 访问 控制 (LBAC) ” 细 粒 度 的 数据 库 安全 形式 ， 可 以 控制 谁 可 以 读 取 和 写 入 到 个 别 的 行 和 列 。 


锁 ， 用 来 确保 数据 完整 性 的 DBM 功能 。 当 某 个 数据 库 资 源 由 一 个 进程 锁定 时 ， 其 他 进程 不 允许 改变 锁定 的 数据 。 为 了 使 
DBMS 促 进 事务 处 理 的 ACID 属性 ， 锁 定 很 有 必要 。 


锁 升级 ”增加 某 个 进程 或 程序 的 锁 粒 度 的 过 程 。 
日 志 ”描述 在 DBMS 运 行 期 间 所 发 生 的 事件 的 顺序 的 记录 集 ， 可 以 在 DBMS 出 现 故 障 时 用 来 恢复 数据 库 。 


逻辑 数据 模型 ”一 种 详细 的 数据 模型 ， 由 完全 规范 化 的 实体 (所 有 属性 都 已 定义 ) 组 成 。 此 外 ， 除 了 为 每 个 实体 都 定义 主 
码 ， 每 个 属性 的 域 或 数据 类 型 也 都 必须 定义 。 逻 辑 数 据 模型 应 该 是 一 个 完整 的 文档 ， 从 这 个 文档 可 以 开发 出 物理 数据 库 。 


HTH ”在 写 满 活动 日 志文 件 且 日 志 记 录 必 须 保留 的 情况 下 ， 将 活动 日 志 数 据 移动 到 归档 日 志 (可 以 移 到 磁盘 或 磁带 ) 的 


日 志 写 入 (LGWR) ”管理 重 做 日 志 缓 冲 区 的 Oracle 进 程 。 


多 对 多 关联 ”两 个 实体 之 间 的 关系 ， 其 中 关联 双方 的 基数 都 有 多 个 。 
兆 字 节 (MB) ”一 百 万 个 字 节 的 存储 空间 ; 1000 个 干 字 节 (KB) 。 
Ar ”数据 在 芯片 的 存储 空间 。 


消息 队列 ”数据 移动 的 形式 ， 数 据 以 消息 的 形式 由 一 个 应 用 程序 或 进程 放 到 队列 中 ， 并 由 另 一 个 应 用 程序 或 进程 从 队列 中 读 


元 数据 TRUER AE Ue “SRA” . UI, TOUR, GETS, WORE. KE, SCH 
以 及 其 他 特征 。 


中 间 件 ”用 来 连接 另外 两 个 单独 的 应 用 程序 的 软件 。 


多 维 数据 “OLAP 和 数据 仓库 使 用 的 立方 数据 。 为 了 分 析 查 询 ， 该 数据 由 纬度 分 类 的 数字 事实 组 成 。 


NAS (网 络 附加 存储 ) ” 指 的 是 存储 可 以 直接 从 网 络 进行 访问 。 有 了 NAS， 主 机 或 客户 端 系 统 就 可 以 通过 一 个 网 络 接口 读 
取 数 据 。 


.NET ”Microsoft 的 程序 开发 框架 ， 为 应 用 程序 的 构建 、 部 署 和 管理 提供 了 一 个 综合 的 平台 。 
规范 化 ”组 织 数据 以 尽量 减少 元 余 并 消除 模糊 性 的 过 程 。 简 单 来 说 ， 规 范 化 是 识别 每 个 事实 所 属 的 最 佳 地 方 的 过 程 。 


空 在 属性 (或 列 ) 层面 ， 代 表 信息 缺失 或 未 知 。 如 果 一 个 属性 (或 列 ) 的 值 可 为 空 ， 有 两 种 意思 : 该 属性 、 列 不 适合 该 实 
体 的 某 些 实例 ; 或 者 该 属性 适用 于 所 有 的 实体 实例 ， 但 信息 可 能 未 知 。 也 可 能 这 两 种 情况 都 包括 。 


O 


对 象 ”一 种 由 数据 和 方法 及 其 交互 组 成 的 结构 。 一 个 对 象 不 仅 只 有 数据 ， 还 封装 了 数据 的 状态 和 行为 (方法 ) 。 


面向 对 象 ”一 种 依靠 对 象 来 设计 应 用 程序 和 计算 机 程序 的 编程 范式 。 


对 象 天 系 ” 起 初 作为 面向 对 象 技 术 与 关系 的 合并 ， 但 一 般 的 做 法 仅 是 指 支持 大 型 多 媒体 数据 类 型 的 DBMS， 使 用 户 能 够 定义 
自己 的 数据 类 型 和 消 数 。 


实例 (occurrence) ”实体 的 一 个 实例 (instance) 。 


ODBC (开放 式 数 据 库 连 接 ) ”与 数据 库 进 行 交互 的 调用 级 别 的 接口 (CLI) 。ODBC 提 供 分 配 和 释放 资源 的 例 程 ， 控 制 到 
数据 库 的 连接 ， 执 行 SQL 语句 ， 获 得 诊断 信息 ， 控 制 事务 终止 ， 并 获得 有 关 实 施 的 信息 。 


一 对 多 关联 两 个 实体 之 间 的 联系 ， 其 中 关联 一 方 的 基数 为 一 ， 而 另 一 方 的 基数 为 多 。 
一 对 一 关联 ”两 个 实体 之 间 的 关系 ， 其 中 关联 双方 的 基数 都 是 一 。 


在 线 分 析 处 理 (OLAP) ”为 存储 在 数据 库 中 的 数据 提供 分 析 的 计算 机 处 理 。OLAP 工 具 使 用 户 可 以 分 析 多 维 数据 的 不 同 维 


在 线 事务 处 理 (OLTP) ”计算 机 立即 响应 用 户 请 求 的 计算 机 处 理 。 每 个 请 求 都 是 一 个 事务 。 与 事务 处 理 相 对 应 的 是 批 处 
理 。 


OO 面向 对 象 。 


开放 式 数据 库 连 接 (ODBC) Microsoft 开发 的 标准 数据 库 访问 技术 ， 其 目的 是 使 任何 应 用 程序 都 可 以 访问 DBMS， 无 论 
哪个 DBM S 管 理 着 数据 。 


操作 系统 ”使 一 台 计 算 机 可 以 运作 的 控制 程序 。 操 作 系统 执行 各 种 基本 的 任务 ， 如 识别 键盘 输入 ， 发 送 输出 到 屏幕 ， 跟 踪 磁 
盘 上 的 文件 和 目录 ， 以 及 控制 外 围 设备 如 磁盘 驱动 和 打印 机 。 


操作 型 数据 人 存储 (ODS) ”为 了 数据 的 其 他 操作 ， 而 集成 来 自 多 个 源 的 数据 的 数据 库 设 计 。 


光盘 一 种 将 二 进 制 数据 (位 ) 编码 为 特殊 材料 (通常 是 铝 ) 上 的 凹 坑 (0 的 二 进 制 值 或 off， 由 于 读 取 时 缺乏 反射 ) 和 平面 
(1 的 二 进 制 值 或 on， 由 于 读 取 时 的 反射 ) 的 扁平 圆 盘 ， 这 些 凹 坑 和 平面 位 于 圆 盘 其 中 一 个 平坦 的 表面 上 。 例 如 ，CD 和 DVD。 


优化 程序 ”关系 数据 库 系统 的 组 件 ， 负 责 分 析 SQL 查 询 并 生成 从 数据 库 检 索 数 据 的 最 佳 访问 路 径 。 
可 选择 性 ”在 数据 建 模 中 ， 无 论 强制 天 系 还 是 可 选 天 系 ， 通 常 都 称 为 可 选 性 关系 。 


ORM (对 象 天 系 映 射 ) ” 借 此 ， 对 象 的 属性 可 以 存储 在 天 系 表 的 一 列 或 多 列 中 。 


帕 雷 托 法 则 ”很 少 的 努力 可 以 得 到 很 大 的 回报 。 也 称 作 80/20 法 则 ， 因 为 通常 是 80% 的 结果 取决 于 20% 的 努力 。 
分 区 (1) 数据 库 文件 的 子 集 ; (2) 避 开 文件 系统 的 物理 操作 系统 存储 区 域 。 
密码 ”用 于 授权 的 机 密 字 或 机 密 字符 串 ， 证 明 身 份 或 获得 某 资源 的 访问 权 。 


PCI DSS (Payment Card Industry Data Security Standard) ”由 主要 的 信用 卡 公司 制定 的 行业 规章 ， 有 助 于 阻止 信用 卡 
欺诈 、 黑 客 以 及 其 他 安全 问题 。 


物理 数据 模型 ”使 用 某 种 特定 的 DBMS 产 品 (例如 ，DB2、Oracle、SQL Server 等 ) ， 将 逻辑 数据 模型 转换 成 一 种 物理 实 


谓词 ”可 以 认为 是 true 或 false 的 语句 ， 如 SQL 语句 的 WHERE 字句 。 


EB ”用 于 唯一 标识 实体 实例 的 属性 或 属性 组 。 每 个 实体 都 必须 有 且 只 有 一 个 主 码 。 

特权 ”可 以 授权 给 DBMS 用 户 的 行动 或 能 力 (如 表 访 问 ) 。 

积极 主动 ”在 遇 到 问题 之 前 从 事 纠 正 的 行为 或 者 活动 。 

进程 监视 器 (PMON) ” 当 用 户 进程 因 错 误 条 件 而 失败 时 ， 执 行 清理 工作 的 Oracle 后 台 进 程 。 
程序 全 局 区 (PGA) ”Oracle 进程 作为 工作 区 的 基本 内 存 结构 。 


传播 ”根据 预先 定义 好 的 法 则 ， 来 自 一 个 或 多 个 源 数 据 库 的 数据 分 友 到 一 个 或 多 个 目标 数据 库 。 


查询 (1) 针对 数据 库 编写 和 发 出 的 一 个 SQL SELECT 语 句 ; (2) 为 了 从 数据 库 中 请 求 数据 。 


RAID (独立 元 余 磁 盘 阵 列 ) ”使 用 两 个 或 多 个 驱动 器 ， 并 且 结 合 了 驱动 容错 和 改进 的 性 能 的 磁盘 驱动 器 。 


被 动 ”只 有 在 遇 到 问题 之 后 才 从 事 纠正 行为 或 者 活动 。 


读 取 效 率 ， 计 算数 据 高 速 缓存 (或 缓冲 池 ) 的 效率 的 公式 。 其 计算 为 数据 请 求 总 数 减 去 实际 执行 的 /O 次 数 ， 然 后 除 以 数据 
请 求 的 总 数 。 


记录 平面 文件 中 的 实例 数据 的 物理 表示 。 

恢复 ”数据 库 恢 复 到 前 一 个 时 间 点 的 状态 ， 通 常 为 了 响应 硬件 或 软件 的 故障 。 

恢复 时 间 目 标 (RTO) ”业务 可 以 容忍 计算 系统 脱 机 的 时 间 的 表达 。 

重 做 日 志文 件 在 恢复 场景 (Oracle) 中 会 用 到 的 数据 变更 的 记录 。 

引用 约束 ”一 种 规范 ， 即 DBMS 可 以 强制 一 个 表 外 码 的 值 或 者 为 空 ， 或 者 为 男 一 个 表 (或 者 同一 个 表 ) 已 有 的 主 码 的 值 。 
引用 完整 性 (RI) ”通过 适当 的 引用 约束 的 规范 ，RI 可 以 保证 每 个 外 码 列 的 值 始 终 是 合理 的 。 

合 规 性 ”满足 政府 立法 或 行业 规定 的 各 种 需求 的 法 案 。 


关系 闭 包 ”关系 数据 库 系 统 的 功能 ， 即 关系 数据 库 上 执行 的 每 一 个 操作 都 作用 在 一 个 表 (或 一 组 表 ) ， 而 结果 却 在 另 一 个 


关系 模型 ”基于 一 级 谓词 逻辑 的 数据 库 模 型 ， 由 Edgar F.Codd (IBM) 在 1969 年 首次 制定 和 提出 。 当 今 流行 的 大 多 数 
DBMS 产 品 的 原型 都 是 关系 模型 。 


关联 定义 了 不 同 的 实体 间 是 如 何 彼此 关联 的 。 关 联 是 由 码 定义 的 : 父 实体 的 主 码 和 依赖 实体 的 外 码 。 

次 版 本 (release) ”次 版 本 代表 了 软件 的 唯一 的 状态 。 次 版 本 通常 很 小 ， 改 变 比较 少 且 没有 大 版 本 那么 多 的 新 功能 。 
可 靠 性 ” 某 个 组 件 (服务 器 、 应 用 程序 、 数 据 库 等 ) 或 一 组 组 件 持续 执行 功能 的 能 力 。 

远程 过 程 调用 (RPC) ”调用 另 一 个 平台 上 的 服务 的 机 制 。 

复制 ”根据 规则 ， 将 数据 从 一 个 数据 源 复制 到 一 个 或 多 个 目标 环境 中 。 

存储 库 ”企业 数据 资产 相关 信息 的 存储 空间 。 

RMAN 用 于 管理 Oracle 数 据 备份 和 恢复 的 数据 库 系统 软件 。 


角色 (1) 用 来 指 可 分 配给 某 个 人 或 企业 的 相关 责任 的 逻辑 集合 的 名 称 ; (2) 数据 库 的 安全 机 制 ， 用 来 向 用 户 授 予 一 种 
或 多 种 预先 分 配 的 特权 。 


ER 在 事务 提交 之 前 ,撤销 数据 库 语 句 的 执行 。 
行 ” 用 于 描述 表 的 一 个 逻辑 实例 的 一 组 列 值 。 


RTO” 见 “恢复 时 间 目 标 ”。 


SAN (存储 区 域 网 络 ) ”一 般 是 指 存储 设备 间 相 互 连 接 的 网 络 。 


Sarbanes-Oxley (SOX) ” ”Sarbanes-Oxley 法 案 ，2002 年 正式 称 为 《美国 公众 公司 会 计 改 革 和 投资 者 保护 法 》。 政 府 调控 
的 目标 是 减少 欺诈 和 利益 冲突 ， 提 高 信息 披露 和 财务 报告 ， 并 加 强 公共 会 计 的 信心 。 


可 扩展 性 ”能够 为 了 增加 成 本 效益 而 增 大 或 减 小 规模 或 能 力 ， 并 且 将 对 业务 和 额外 服务 的 采购 单位 成 本 的 影响 降 到 最 小 。 
扫描 RRE (或 表 空 间 ) 的 所 有 行 来 满足 查询 需要 (与 索引 访问 相反 ) 的 过 程 。 


模式 (1) 数据 元 素 、 物 理 特性 和 关联 的 逻辑 或 物理 定义 ; (2) 表示 逻辑 数据 模型 的 图 表 。 


第 2 范式 (2NF) ” 当 且 仅 当 一 个 实体 满足 第 1 范式 ， 并 且 每 个 非 码 属性 都 完全 依赖 码 时 ， 该 实体 就 满足 第 2 范式 。 
安全 ”防止 未 经 授权 而 访问 数据 库 及 其 数据 ， 以 及 可 以 访问 数据 库 的 应 用 程序 。 

选择 ”指定 关系 型 数据 库 的 数据 检索 操作 的 SQL 语句 。 

服务 等 级 协议 (SLA) ”一 种 合同 ， 用 于 保证 向 程序 、 事 务 、 服 务 或 工作 量 所 提供 的 服务 。 


服务 等 级 管理 (SLM) ”纪律 严明 、 积 极 进取 的 方法 和 程序 ， 以 确保 按照 业务 优先 级 和 可 接受 的 成 本 能 够 为 用 户 提供 足够 
的 服务 等 级 。 


面向 服务 的 架构 (SOA) ”应 用 程序 架构 ， 其 中 所 有 功能 或 服务 的 创建 都 使 用 可 调用 的 接口 (调用 执行 业务 流程 ) 。 
共享 磁盘 一 种 集群 的 形式 ， 其 中 所 有 连接 的 系统 都 共享 同一 个 磁盘 设备 。 

共享 锁 ” 当 读 取 数据 上 不 打算 更 新 它 时 ，DBMS 采 用 的 一 种 锁 类 型 。 

无 共享 一 种 集群 的 形式 ， 其 中 每 一 个 系统 都 有 自己 的 专用 资源 (AF, WRS). 

SHOWPLAN ”用 于 将 关系 优化 程序 所 选择 的 访问 路 径 实 现 外 部 化 的 命令 (SQL Server, Sybase ASE) 。 
简单 对 象 访问 协议 见 “SOAP”。 

SOAP (简单 对 象 访问 协议 ) ”一 种 在 Web 服 务实 施 中 交换 结构 信息 的 协议 规范 。 

固态 硬盘 驱动 (SSD) ”使 用 固态 内 存 存 储 永久 性 数据 的 数据 存储 设备 。 

SOX Jl “Sarbanes-Oxley” 。 


SQL 起 初 只 是 结构 化 查询 语言 的 初始 化 ， 但 现在 自 成 一 体 。 发 音 同 “sequel” 或 “ess-cue-el”，SQL 是 用 于 访问 关系 数 
据 库 的 事实 上 的 标准 语言 。 


SQL 注入 ”Web 黑客 的 一 种 形式 ，SQL 语 句 指定 在 Web 中 ， 从 而 使 数据 暴露 给 攻击 者 。 


备用 数据 库 ”在 线 生产 数据 库 的 相同 副本 ， 根 据 其 数据 的 内 容 进行 更 新 。 当 发 生 故 障 时 ， 控 制 权 交 给 备用 数据 库 ， 它 会 作为 
在 线 的 生产 数据 库 使 正常 的 活动 继续 。 


星 型 模式 ”常见 的 一 种 维度 数据 模型 ， 其 中 事实 表 直 接 由 外 码 连 接 到 几 个 维度 表 。 

静态 SQL ”经 过 预先 处 理 的 SQL 查询 ， 它 们 的 访问 路 径 在 绑 定 期 间 (执行 前 ) 就 已 经 确定 。 
存储 过 程 一 种 预 编译 的 例 程 或 程序 ， 存 储 在 DBMS 中 ， 使 用 DBMS 命 令 可 以 运行 。 
系统 全 局 区 域 (SGA) ” 一 组 共享 的 内 存 结构 ， 供 Oracle 数 据 库 实例 保存 数据 和 控制 信息 。 


系统 监控 进程 (SMON) ”在 启动 期 间 提供 实例 恢复 的 Oracle 后 台 进 程 。 


表 分 为 行 和 列 的 二 维 数据 排列 。 

表 空 间 一 种 结构 或 数据 库 对 象 ， 一 些 DBMS 产 品 用 它们 来 存储 和 组 织 数 据 库 表 。 

TCO 见 “ 和 总 体 拥有 成 本 ”。 

Ne ”与 时 间 有 关 。 

AFT (TB) ”一 万 亿 个 字 节 的 存储 空间 ; 1000 个 干 兆 字 节 (GB) 。 

瘦 客 户 端 一 种 客户 端 / 服 务 器 处 理 模型 ， 其 中 只 有 有 限 的 功能 驻 留 在 客户 端 计算 机 上 。 

第 3 范式 (3NF) ” 当 且 仅 当 一 个 实体 满足 第 2 范式 ， 并 且 每 一 个 非 码 属性 都 直接 依赖 主 码 时 ， 该 实体 满足 第 3 范式 。 
B 计算 责任 的 分 离 级 别 。 

超时 ”在 一 个 进程 等 待 了 预先 确定 的 时 间 (通常 由 系统 参数 说 明 ) 后 取消 。 超 时 通常 与 等 待 授予 锁定 有 关 。 

总 体 拥 有 成 本 (TOC) ”在 一 个 产品 的 整个 生命 周期 内 ， 拥 有、 实施 和 维护 的 总 成 本 。 


TPC 事务 处 理性 能 委员 会 (Transaction Processing Performance Council) ， 是 一 家 管理 性 能 基准 测试 的 独立 的 、 非 
盈利 性 组 织 。 


流量 ”网络 操作 中 ， 通 过 网 络 的 包 的 数量 。 

事务 关于 恢复 和 一 致 性 的 原子 工作 单元 。 

触 友 器 ”数据 库 表 所 附带 的 一 种 受 事件 驱动 的 专门 程序 ， 它 的 实施 通常 是 为 了 支持 数据 的 完整 性 需求 。 

两 阶段 COMMIT (2PC) 事务 处 理 系 统 的 功能 ， 在 出 现 错 误 的 情况 下 ， 可 以 使 数据 库 返 回 到 事务 之 前 的 状态 。 


元 组 一 组 元 素 ; 天 系 表 中 ， 行 的 正式 数学 术语 。 


联合 ”一 种 SQL 功能 ， 可 以 将 具有 相同 列 结构 的 两 个 ?SELECT 语句 的 结果 合并 为 一 个 回答 集 。 


工作 单元 (VOW) ”一 系列 (运行 时 ) 保证 数据 完整 性 的 过 程 、 指 导 和 消息 。 按 照 工 作 单 元 处 理事 务 很 重要 ， 要 么 没有 ， 
要 么 所 有 的 过 程 都 执行 完毕 。 


更 新 (1) 修改 关系 数据 库 中 的 数据 的 SQL 语句 ; (2) 通用 术语 ， 指 数据 库 的 任何 变更 。 


更 新 锁 “在 修改 数据 之 前 必须 要 读 取 数据 时 ，DBMS 采 用 的 锁 类 型 。 更 新 锁 表 明 在 将 来 可 能 会 修改 或 删除 数据 。 如 果真 的 要 
修改 或 删除 数据 ，DBMS 会 将 更 新 锁 升 级 为 排他 锁 。 


用 户 ” 认 可 和 授权 可 以 访问 特定 的 应 用 程序 或 数据 库 资源 的 个 人 或 角色 。 
用 户 自 定义 数据 类 型 (UDT) ”添加 到 DBMS 中 ， 且 可 以 像 内 置 数据 类 型 一 样 使 用 的 可 配置 的 数据 类 型 。 


用 户 自 定义 函数 ”添加 到 DBMSs 中 ， 且 可 以 像 内置 数 据 库 函 数 一 样 调用 的 可 扩展 的 代码 。 


E 分 配给 单个 属性 县 相当 于 一 个 事实 的 抽象 数据 。 


版 本 (version) ”版 本 代表 了 软件 的 唯一 状态 。 与 次 版 本 (release) 对 比 ， 软 件 的 新 版 本 受到 极 大 的 关注 ， 变 化 很 大 ， 新 
功能 很 多 。 


视图 虚拟 表 (定义 为 SQL SELECT 语句 ) ， 为 一 个 或 多 个 表 中 的 数据 提供 一 个 子 集 。 


工作 量 系统 已 经 完成 或 能 够 执行 的 工作 量 ， 通 常 在 一 段 特 定 的 时 间 内 。 


XML (可 扩展 标记 语言 ) ”与 HTML 类 似 的 标记 语言 ， 基 于 SGML (标准 通用 标记 语言 ) 。HTML 使 用 标签 (tag) 来 描述 
数据 如 何在 Web 页 面 上 出 现 。 它 常用 于 Web 应 用 程序 描述 数据 。 


XQuery 一 种 可 以 从 XML 文 档 或 XML 数 据 库 中 检索 数据 的 查询 语言 。 


修正 (zap) ”用 于 在 字 节 (或 位 ) 级 别 修改 数据 的 实用 程序 或 命令 ， 通 常用 来 解决 系统 问题 ， 如 不 正确 的 指针 值 。 


zSeries 1BM 的 大 型 机 计算 硬件 。 


